【问题标题】:Showing Links Going To A Domain Or Page Using Nutch使用 Nutch 显示指向域或页面的链接
【发布时间】:2013-03-17 02:04:28
【问题描述】:

我在 ubuntu 上使用 nutch 和 solr。我想使用 php 来查询数据库或其他方法以从索引页面返回一组链接,这些页面指向任何特定的 url 或域。请指出正确的方向。

我用这个教程设置了蜘蛛http://nlp.solutions.asia/?p=180

我还想指出,首选是 php 语言选项或通过 php curl 或命令行界面与 nutch 或 sorl 应用程序的 api 接口。 谢谢

【问题讨论】:

    标签: nutch web-crawler


    【解决方案1】:

    我注意到数据库内部存储了链接,因此在解析每一行的链接后,执行以下查询将获得到 creativecommons.org 域的索引入站链接:

    选择 * 来自网页 WHERE inlinks LIKE '%creativecommons.org%'

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2014-11-01
      • 1970-01-01
      • 2019-02-07
      • 1970-01-01
      • 2019-02-28
      • 1970-01-01
      • 2015-04-04
      相关资源
      最近更新 更多