【发布时间】:2013-06-21 05:03:42
【问题描述】:
我正在使用apache-nutch-2.1 进行抓取。是否可以将爬取的结果作为 json 获取?我编写了一个使用 apache-nutch-2.1 进行爬网的 java 程序。我将如何将爬取的结果作为 JSON 检索。这可能是一个愚蠢的问题,但是当我用谷歌搜索它时。与此无关。
如何添加我获取爬取结果的json?
【问题讨论】:
标签: java apache web-crawler nutch
我正在使用apache-nutch-2.1 进行抓取。是否可以将爬取的结果作为 json 获取?我编写了一个使用 apache-nutch-2.1 进行爬网的 java 程序。我将如何将爬取的结果作为 JSON 检索。这可能是一个愚蠢的问题,但是当我用谷歌搜索它时。与此无关。
如何添加我获取爬取结果的json?
【问题讨论】:
标签: java apache web-crawler nutch
您正在寻找的功能已经实现:Nutch-932 retrieve crawl results as JSON
上面的链接也有使用示例。
【讨论】: