【问题标题】:How can I know the docs changed,updated and indexed in solr index?我如何知道 solr 索引中的文档已更改、更新和索引?
【发布时间】:2013-08-06 00:11:06
【问题描述】:

在将用于索引的 xml 文档发布到 solr 时,会添加一些文档并丢弃重复记录。一些记录也正在更新为新值。我如何知道对 index.html 所做的这些更改。我的意思是我将如何知道添加的记录数量,不。更新的记录数量,发布到 solr 核心的文档数量?

【问题讨论】:

    标签: search solr indexing


    【解决方案1】:

    在 Solr 4 中,在集合部分下,有一个名为 Plugins/Stats 的子部分。在其中,有一个 UpdateHandler 类别,其统计信息与您所要求的类似。

    此外,还可以监视更改。结合起来,这可能会给您一种方法来查看这些是否是您想要的。如果是,那么您应该通过 JMX 访问相同的值,以便更灵活/长期跟踪。

    【讨论】:

    • localhost:8983/solr/collection1/admin/mbeans?stats=true 这个网址只告诉被索引、发布和丢弃的文档数量。但我想知道被索引(添加)的文档的 ID,在发布用于索引的文档时删除。我正在实施文档重复检测。所以我想知道 solr 丢弃的重复文档。
    • 或者在将新的 xml 文件发布到 solr 之前,有什么方法可以知道 solr-index 中是否已经存在文档??
    • 这些似乎与您开始提出的问题完全不同。我建议关闭这个并重新开始。但很快,请查看 UpdateRequestProcessors 以及现有 Solr Dedupe 组件的来源。
    猜你喜欢
    • 2011-07-10
    • 1970-01-01
    • 2016-03-04
    • 1970-01-01
    • 2012-01-25
    • 1970-01-01
    • 2015-05-11
    • 2011-05-27
    • 1970-01-01
    相关资源
    最近更新 更多