【发布时间】:2016-04-12 06:17:54
【问题描述】:
我使用命令'bin/nutch webgraph -segmentDir crawl/segments -webgraphdb crawl/webgraphdb'.. 在apache nutch 中生成了webgrapgh db。它在 crawl/webgraphdb 中生成了三个文件夹,分别是内链接、外链接和节点。这些文件夹中的每一个都包含两个二进制文件,例如数据和索引。如何在 apache nutch 中获取可视化网络图?网络图有什么用?
【问题讨论】:
-
你在哪里可以解决这个问题?我仍在获取二进制文件。如何获得可读的 inlinks_webgraph 和 outlinks_webgraph