【问题标题】:Apache Lucene IndexingApache Lucene 索引
【发布时间】:2012-07-26 08:07:12
【问题描述】:

我正在学习 Apache Lucene,我对索引的性能有一些疑问,

  1. 我正在根据数据库中的数据构建索引,数据库的架构是 Lucene 文档的架构。
  2. 我有两个选项可以回复搜索。首先是搜索索引并用索引响应值,否则搜索索引,获取结果的id(即表的主键)并查询数据库。对于前者,我需要将表的值存储在索引中,以便我可以使用 Index.Store.Yes 检索值,而对于后者,它足以索引数据而不是使用 Index.Store 存储数据。否,因此索引不会更大。
  3. 使用前一种技术会影响性能(通过存储所有值来搜索索引)或搜索索引并查询数据库(通过存储所有值)会影响性能。
  4. 哪种方法最好,或者是否有任何其他解决方案可以解决上述问题

【问题讨论】:

    标签: apache lucene


    【解决方案1】:

    这真的取决于,如果您要拥有一个庞大的数据集,通常最好保持索引尽可能轻,并按照您的描述查询数据库。但是,如果数据集很小,也可以存储它们...

    【讨论】:

      【解决方案2】:

      在 Apache Lucene 中搜索操作的性能取决于索引文件的权重。保持它尽可能轻。那么在你的情况下,我建议对这两种情况进行时间戳测试。至少进行 20 次以上的观察。计算一个平均值。那么得到的统计数据肯定会帮助您做出决定。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2013-07-07
        • 1970-01-01
        • 2015-05-06
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2015-08-28
        相关资源
        最近更新 更多