【问题标题】:Gremlin-server create a graph by loading data from csv files from gremlin-pythonGremlin-server 通过从 gremlin-python 加载 csv 文件中的数据来创建图形
【发布时间】:2018-04-26 12:43:21
【问题描述】:
【问题讨论】:
标签:
python
csv
gremlin
gremlin-server
【解决方案1】:
TinkerPop 并不真正提供批量加载工具,而是依赖于图形数据库的本机特性来公开此类功能。 TinkerPop 唯一拥有的批量加载工具是BulkLoaderVertexProgram,您可以使用它以并行分布式方式加载大量图表。除此之外(特别是如果您没有大图),您只需编写一个 Gremlin 脚本来读取您的源数据,然后使用 Gremlin 突变步骤(即addV() 和addE())将数据加载到您的图中。如果您以一次性方式加载,我会从 Gremlin 控制台执行这样一个脚本并生成您的图表。
所以,再次,三个选项:
- 编写 Gremlin 脚本以在 Gremlin 控制台中执行以加载数据。
- 如果您有一个特别大的图表,请考虑
BulkLoaderVertexProgram 和 Hadoop/Spark
- 考虑您选择的图形数据库可用的批量加载工具。
无论您做出何种选择,首先执行加载,然后将该图表连接到 Gremlin 服务器。此时您可以使用 gremlin-python 查询加载的数据。
您可能会从 Jason Plurad 的演讲中发现这个幻灯片很有帮助:"Powers of Ten Redux",它建立在我与 Daniel Kuppitz 在“十的幂”博客文章系列中为数据加载所做的原始工作的基础上。