【发布时间】:2018-02-09 06:03:38
【问题描述】:
我按照教程从
Nutch Wiki "SetupNutchAndTor"(https://wiki.apache.org/nutch/SetupNutchAndTor)
-
设置
nutch-site.xml<property> <name>http.proxy.host</name> <value>127.0.0.1</value> <description>The proxy hostname. If empty, no proxy is used. </description> </property> <property> <name>http.proxy.port</name> <value>8118</value> <description>The proxy port.</description> </property>
但仍然没有从 .onion 链接中爬取任何内容,也没有索引到 Solr。有谁知道是什么问题?
【问题讨论】:
标签: solr web-crawler nutch deep-web