【发布时间】:2016-06-08 12:18:39
【问题描述】:
我正在尝试将大型数据集导入 neo4j。我创建了一个 Python 脚本,在读取 .xls 文件后将密码查询写入 .cql 文件,然后使用 neo4j-shell 运行它们。这适用于一个小数据集。但是在增加数据集的大小时,我的系统同样崩溃了。
我很少看到使用批处理导入器的建议,但它们通常基于 Java(例如:Groovy),我不太喜欢使用它。那么除了批量插入或至少通过 Python 进行批量插入之外,还有其他选择吗?
【问题讨论】:
-
我会使用 neo4j-import 工具。 neo4j.com/docs/operations-manual/current/#import-tool
-
效果很好,但我只需要为所有列创建 id 以加入关系吗?我不太了解有关 :ID 和 :IGNORE 的文档......所以几乎没有帮助不错
标签: python neo4j neo4j-batch-inserter large-data