【问题标题】:Apache Solr XPathEntityProcessor DIH - Index UpdateApache Solr XPathEntityProcessor DIH - 索引更新
【发布时间】:2012-12-17 12:47:05
【问题描述】:

我对 Apache SOlr 比较陌生,最近一直在使用 DIH,特别是 XPathEntityProcessor。我需要一种定期索引新 XML 文件的方法,但是,似乎 delta-import 命令仅受 sqlEntityProcessor [1] 支持。

我正在处理越来越大的 XML 文件数据集,并希望 solr 可以确定新文件并为它们编制索引...

想到的一个潜在解决方案是,在将文档移动到各自的永久位置之前,可能从包含先前未编入索引的文档的暂存区域进行完全导入。

  1. 是否有使用 XPathEntityProcessor 模拟 delte-import 的解决方法?
  2. 使用 XPathEntityProcessor 的人使用哪些方法来索引较新的文档?

[1]http://wiki.apache.org/solr/DataImportHandler#Using_delta-import_command-1

【问题讨论】:

  • 根据我目前收集到的信息,我可能需要编写自己的样式表来将输入的 XML 文件转换为 Solr 格式,并以编程方式将结果发送到 Solr 进行索引...不过,如果 delta-import 是使用 XPathEntityProcessor 本地实现的,那就容易多了。

标签: solr


【解决方案1】:

我已经使用了 UpdateRequestHandler;它非常适合我想做的事情。

[1]http://wiki.apache.org/solr/XsltUpdateRequestHandler

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-02-20
    • 2016-01-07
    • 1970-01-01
    • 1970-01-01
    • 2012-01-25
    • 1970-01-01
    相关资源
    最近更新 更多