【发布时间】:2013-03-17 02:04:28
【问题描述】:
我在 ubuntu 上使用 nutch 和 solr。我想使用 php 来查询数据库或其他方法以从索引页面返回一组链接,这些页面指向任何特定的 url 或域。请指出正确的方向。
我用这个教程设置了蜘蛛http://nlp.solutions.asia/?p=180
我还想指出,首选是 php 语言选项或通过 php curl 或命令行界面与 nutch 或 sorl 应用程序的 api 接口。 谢谢
【问题讨论】:
标签: nutch web-crawler