【发布时间】:2014-09-20 06:30:06
【问题描述】:
我正在使用 nutch 1.9,使用 cygwin 和 solr 4.8.0。我可以使用下面的代码将爬取的数据索引到 solr 中。
bin/crawl urls/ crawlresult/ http://localhost:8983/solr/ 1
但我想在索引时添加一些额外的字段,例如 indexed_by、crawled_by、crawl_name 等。
我需要这方面的帮助。
提前致谢。
【问题讨论】:
标签: solr cygwin web-crawler nutch