【发布时间】:2019-01-22 06:39:50
【问题描述】:
我们使用的是 Nutch 2.3.1-src 版本。执行深度为 200 的抓取命令。但经过几次迭代后,获取失败并出现下面提到的运行时异常。
java.lang.RuntimeException: java.lang.IllegalArgumentException: KeyValue size too large
Exception at GoraRecordWriter.class while writing to datastore: KeyValue size too large
抓取命令:
/Data/Apache/apache-nutch-2.3.1/runtime/local/bin/crawl /Data/Apache/apache-nutch-2.3.1/runtime/local/urls crawl-nutch http://localhost:9200/test/ 200
【问题讨论】:
标签: web-crawler nutch depth