【问题标题】:Gremlin: how works IO import with pythonGremlin:如何使用 python 导入 IO
【发布时间】:2021-03-11 16:19:59
【问题描述】:
我想知道从命令 g.io('file.json').read().iterate() 调用的函数是什么
我看到在 step_instructions 中放置了一个“读取”步骤,但我找不到将文件导入图表的原始函数。
这是因为我想使用 python 对象导入大量数据但没有文件。
我看到 io().read() 在一分钟内导入了一个大文件,我想重新创建它但不使用文件。
非常感谢。
【问题讨论】:
标签:
python
file
import
io
gremlin
【解决方案1】:
首先要明确命名法,io() 是一个步进,而read() 和write() 是步进调制器,这些调制器只能应用于io() 步进来告诉它分别读取或写入.因此,由于io() 目前仅适用于字符串文件名,因此您只能读取/写入文件。
如果您想使用 Python 发送“大量数据”,我会首先考虑您所说的大小是什么意思。如果您谈论的是数百万个顶点和边,您应该首先检查您使用的图形数据库是否有自己的批量加载工具。如果是这样,你应该使用它。在 JanusGraph 的情况下,您还可以考虑使用 Gremlin/Spark 的方法,如 here 所述。最后,如果您必须使用纯 Gremlin 进行批量加载,那么使用 Python 对象进行参数化遍历(我假设某种list/dict)可能是可以采用的方法。这个blog post 可能会为这种思路提供一些灵感。