【发布时间】:2014-02-05 20:12:27
【问题描述】:
我在我的 centOS 虚拟机上安装 nutch2.2.1 并在注入种子 URL(目录名称)时出错。我使用了这个命令:
/usr/share/apache-nutch-2.1/src/bin/nutch inject root/apache-nutch-2.1/src/testresources/testcrawl urls
我得到了一个错误:
Error: Could not find or load main class org.apache.nutch.crawl.InjectorJob
同样,对于命令
/usr/share/apache-nutch-2.1/src/bin/nutch readdb
给我一个错误:
Error: Could not find or load main class org.apache.nutch.crawl.WebTableReader
我应该怎么做才能修复这些错误? 我正在遵循来自http://wiki.apache.org/nutch/Nutch2Tutorial 的教程,并按照建议的步骤进行操作。
此外,我的查询还围绕设置 ant 的路径。每次我打开一个新会话时,我都必须手动设置 ANT_HOME 和 PATH 环境变量。然后他们工作得很好。设置 JAVA_HOME 也是如此。
【问题讨论】:
-
几年前我写了一篇文章,详细介绍了如何设置 Nutch 2。对于路过的人可能会发现它很有用 - abdulmunim.com/configure-nutch-2-with-hbase
标签: nutch