【发布时间】:2012-03-26 14:55:48
【问题描述】:
我们有一个包含 86,315,770 个文档的 solr 实例。它使用多达 4GB 的内存,我们需要它来对称为内容的标记化字段进行分面。磁盘上的索引大小为 23GB。
为什么我们要在标记化字段上进行分面?因为我们要查询该字段中最常用的前“n”个术语。问题是执行此类查询花费的时间太长。像这样进行刻面时,有什么方法可以改善时间吗?有什么建议吗?
提前致谢。
【问题讨论】:
-
你在设置
facet.limit吗?我注意到,如果未设置facet.limit(在您的情况下,无论n可能是什么),即使有 100,000 多条记录,此类查询也可能需要很长时间。
标签: solr faceted-search