【发布时间】:2014-06-09 14:04:50
【问题描述】:
我正在运行 Ubuntu 14.04,我想要让一个基本的 Nutch Web Crawl 运行无济于事。按照this 教程,我设置了以下构建块:
- Ubuntu 14.04
- HBase 0.90.4
- Nutch 2.2.1
- Solr 4.3.1
我确认 HBase 和 Solr 都在运行,我填充了 urls/seed.txt 文件。然后当我打电话时;
bin/nutch inject urls
我看到以下输出,然后看起来 Nutch 只是挂起。
InjectorJob: starting at 2014-06-09 23:38:49
InjectorJob: Injecting urlDir: urls/seed.txt
Thisstackoverflow 问题似乎与我的相似,但我不在代理后面,因此答案不适用。
我们将不胜感激任何解决此问题的帮助。
【问题讨论】:
-
@Andrew-Barber 您能否详细说明为什么我的问题是题外话。我觉得tutorial 的链接与所述教程中的确切故障点以及各自的 Ubuntu 和 Nutch 版本相结合,使问题变得最小、完整和可验证。
标签: solr hbase nutch ubuntu-14.04