【问题标题】:how to grouping result by domain in solr?如何在solr中按域对结果进行分组?
【发布时间】:2012-04-04 05:02:13
【问题描述】:

我用 nutch 爬过很多网站。我正在使用 Solr 3.4 浏览结果,但我想按其域对结果进行分组。例如,如果我搜索“tabnak”,第一个结果只包含“http://tabnak.ir”,并且不显示来自该域的其他结果(就像 google 一样)。

我想忽略以下结果:

http://tabnak.ir/en/news/1020/title
http://tabnak.ir/fa/allnews
...

如何使用 group、group.field 和 ...创建 solr 查询?

谢谢

【问题讨论】:

  • 据我所知,SOLR 不了解域。这只是一个字符串。另外,我觉得这个问题解释得不是很清楚,请再完善一下

标签: solr


【解决方案1】:

您应该创建一个单独的索引字段(例如,在这种情况下名为“域”),并且应该确保在 SOLR 索引您的数据时将域与 url 分开。

然后您必须将字段折叠分组应用于您的搜索结果。见:http://wiki.apache.org/solr/FieldCollapsing

【讨论】:

    猜你喜欢
    • 2012-09-19
    • 1970-01-01
    • 1970-01-01
    • 2013-09-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多