【问题标题】:MergerFacor effect on indexesMergerFactor 对索引的影响
【发布时间】:2011-09-25 20:20:30
【问题描述】:

我的 solrconfig.xml 配置如下:

<mainIndex>
   <useCompoundFile>false</useCompoundFile>
    <ramBufferSizeMB>32</ramBufferSizeMB>
    <mergeFactor>5</mergeFactor>
    <maxMergeDocs>10</maxMergeDocs>
    <maxFieldLength>10000</maxFieldLength>
    <unlockOnStartup>false</unlockOnStartup>
  </mainIndex>

索引大小为 12mb。但是当我更改我的 mergeFactor 时,我在索引中没有发现任何影响。即。段数完全相同。我没有得到哪个配置会影响段数。因为我想它是mergefactor。 我的下一个问题是哪个配置定义了每个段的文档数量以及该段的大小,以便创建下一个段

请把这些点说清楚

【问题讨论】:

    标签: indexing solr


    【解决方案1】:

    对于您的问题:

    • MergeFactor:如果您的 mergefactor 为 10 .. 每 10 个文档将有一个新段,最多 10 个段,而不是每个段添加到 100 个段中,依此类推。
    • MaxMergeDocs 为您提供了在开始合并到新段之前段可以获取的最大文档数。

    所以最终两者都会对细分市场产生影响

    更新:

    如果您使用 dataImportHandler,请确保在完全导入时不要自动优化为 maxSegments=1 以查看效果。

    【讨论】:

    • @fyr:为什么,当我更改合并因子时,我看不到对索引的影响
    • 可能您的测试集或参数不合适。使用合并因子 2 和 maxMergeDocs 10000 以及合并因子 2 和 maxMergeDocs 100 对其进行测试。在这两种情况下,索引 1000 个文档会有所不同。
    • @fyr:正如您在 stackoverflow.com/questions/6533581/… 中看到的那样,我只有 2881 个文档,而不是我的配置来查看效果
    • 您是否使用我的参数和 1000 个文档的子集对其进行了测试?
    • 是的,我已经用你的参数进行了测试。但我的感觉是,如果我只有 2881 个文档,那么它只会创建 1 个段,并且合并因子不会影响这些文档数量。请看stackoverflow.com/questions/6544838/…
    猜你喜欢
    • 2019-05-03
    • 1970-01-01
    • 2012-12-24
    • 2011-09-16
    • 1970-01-01
    • 1970-01-01
    • 2011-02-19
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多