【发布时间】:2012-04-14 10:04:47
【问题描述】:
我的问题是由以下问题引起的。 我有一组从中提取关键字的 Web 文档。我想将这些数据存储在 Neo4j 中以供进一步分析(或多或少包括子图同构问题的图挖掘):每个 Web 文档都是一个节点;从一个网络文档到另一个网络文档的超链接是一种对应的有向关系;关键字是节点的属性。在这种情况下,关键字属性可能会被归属到几个节点(我希望这是可行的)。
我在以下问题上需要帮助(我发现只知道关于 Neo4j 的非常基本的事情很难回答):
1) 是否可以选择具有特定属性“keyword1”的所有节点?
2) 如何为 2 个节点“doc1”和“doc2”选择通用(重叠)关键字属性?即 2 个 Web 文档的常用关键字
3) 为关键字属性创建某种字符串键是否更好(而不是使用默认的自动递增整数)?
任何提示/建议/链接将不胜感激。 我在 Windows 上为 Neo4j 使用 Python 绑定。
【问题讨论】: