【发布时间】:2022-12-28 16:56:02
【问题描述】:
我看到了很多关于如何将顶点和边格式的 csv (Gremlin) 数据加载到 AWS Neptune 中的教程。由于很多原因,我无法为数据加载创建顶点和边。相反,我只有原始 csv 文件,其中每一行都是一条记录(例如一个人)。
如何从笔记本界面的 Neptune 中原始 csv 的每一行记录创建节点和关系?
【问题讨论】:
-
最简单的方法很可能是编写几行 Python 来读取 CSV 并生成 Gremlin 或 openCypher 来创建节点。你能提供原始 CSV 的样本吗?另一种方法是将 CSV 转换为具有批量加载程序期望的标头。您甚至可以在上面运行 CSV-gremlin 工具。
-
@Kelvin 感谢 cmets。我们不能使用 vertices-edges Gremlin bulk loader 的原因是,我们想实现实时摄取。想象一下,我们的平台每分钟都会添加新内容,需要将它们转换为图形节点。我们认为批量加载行不通。你能举一些用opencypher转换逐行记录(带标题)的例子吗?
-
您能否分享 CSV 数据的外观示例?
-
数据示例并不重要。让我们以 Neo4J 的电影数据库为例。有 actors.csv 和 movies.csv。假设我一次只能从两个 csv 文件流式传输 10 行,如何在 Neptune 中构建图形数据库?
标签: amazon-neptune graphdb opencypher