【发布时间】:2019-10-26 02:19:22
【问题描述】:
我想加载一个 csv,其中包含 Wikipedia 类别 rels.csv(类别之间的 400 万个关系)之间的关系。我尝试通过更改以下参数值来修改设置文件:
dbms.memory.heap.initial_size=8G
dbms.memory.heap.max_size=8G
dbms.memory.pagecache.size=9G
我的查询如下:
USING PERIODIC COMMIT 10000
LOAD CSV FROM
"https://github.com/jbarrasa/datasets/blob/master/wikipedia/data/rels.csv?raw=true" AS row
MATCH (from:Category { catId: row[0]})
MATCH (to:Category { catId: row[1]})
CREATE (from)-[:SUBCAT_OF]->(to)
此外,我在 catId 和 catName 上创建了索引。 尽管进行了所有这些优化,查询仍在运行(从昨天开始)。
您能否告诉我是否需要进行更多优化来加载此 CSV 文件?
【问题讨论】:
-
这太长了。我认为您的查询没有使用您设置的所有资源。您可以使用 Halin 检查 Neo4j 的内存利用率。我建议检查一次。 medium.com/neo4j/monitoring-neo4j-with-halin-4c11429b46ff
-
所有配置更改后是否重新启动neo4j?
标签: neo4j cypher database-performance load-csv