【问题标题】:Alternative to batch importer for neo4j for large datasets用于大型数据集的 neo4j 批量导入器的替代方案
【发布时间】:2016-06-08 12:18:39
【问题描述】:

我正在尝试将大型数据集导入 neo4j。我创建了一个 Python 脚本,在读取 .xls 文件后将密码查询写入 .cql 文件,然后使用 neo4j-shell 运行它们。这适用于一个小数据集。但是在增加数据集的大小时,我的系统同样崩溃了。

我很少看到使用批处理导入器的建议,但它们通常基于 Java(例如:Groovy),我不太喜欢使用它。那么除了批量插入或至少通过 Python 进行批量插入之外,还有其他选择吗?

【问题讨论】:

标签: python neo4j neo4j-batch-inserter large-data


【解决方案1】:

您可以尝试 Neo4J Load CSV 工具/密码命令。 它非常灵活,可以与 USING PERIODIC COMMIT 一起使用,通过定期提交来处理非常大的数据集,以防止缓冲区溢出问题并进一步优化流程。

唯一的先决条件是您能够以 CSV 格式导出原始数据。

http://neo4j.com/developer/guide-import-csv/

http://neo4j.com/docs/developer-manual/current/#cypher-query-lang(第 8.6 节)

【讨论】:

猜你喜欢
  • 2018-11-06
  • 1970-01-01
  • 2017-11-08
  • 1970-01-01
  • 2021-10-19
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2014-12-15
相关资源
最近更新 更多