【问题标题】:Using Apache Solr to index Nutch data使用 Apache Solr 索引 Nutch 数据
【发布时间】:2020-02-19 23:21:16
【问题描述】:

我正在尝试设置 Solr 来索引我的 Nutch 爬虫的结果。我在网上找到的教程要求将文件 conf/schema.xml 作为配置的一部分从 Nutch 复制到 Solr,但是这个文件在我的 Nutch 版本中不存在。有没有其他方法可以做到这一点,或者我错过了什么? 干杯

【问题讨论】:

    标签: solr web-crawler nutch


    【解决方案1】:

    "official" Nutch tutorial

    注意:由于NUTCH-2745,schema.xml 不包含在二进制包中。请从源代码库下载schema.xml

    NUTCH-2745 仅适用于 Nutch 版本 1.16,并将在 1.17 中修复。

    【讨论】:

    • 即使在 1.17 中,应用 ./plugins/indexer-solr/schema.xml 中的 xml 后,索引也会失败。只有在托管模式下才能完成索引。但是,对于托管模式,查询失败,因为它抱怨未定义字段 text
    猜你喜欢
    • 1970-01-01
    • 2016-05-26
    • 2023-03-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-03-02
    相关资源
    最近更新 更多