【发布时间】:2012-12-17 12:47:05
【问题描述】:
我对 Apache SOlr 比较陌生,最近一直在使用 DIH,特别是 XPathEntityProcessor。我需要一种定期索引新 XML 文件的方法,但是,似乎 delta-import 命令仅受 sqlEntityProcessor [1] 支持。
我正在处理越来越大的 XML 文件数据集,并希望 solr 可以确定新文件并为它们编制索引...
想到的一个潜在解决方案是,在将文档移动到各自的永久位置之前,可能从包含先前未编入索引的文档的暂存区域进行完全导入。
- 是否有使用 XPathEntityProcessor 模拟 delte-import 的解决方法?
- 使用 XPathEntityProcessor 的人使用哪些方法来索引较新的文档?
[1]http://wiki.apache.org/solr/DataImportHandler#Using_delta-import_command-1
【问题讨论】:
-
根据我目前收集到的信息,我可能需要编写自己的样式表来将输入的 XML 文件转换为 Solr 格式,并以编程方式将结果发送到 Solr 进行索引...不过,如果 delta-import 是使用 XPathEntityProcessor 本地实现的,那就容易多了。
标签: solr