【问题标题】:Solr search based on stemming基于词干的 Solr 搜索
【发布时间】:2016-06-07 20:07:46
【问题描述】:

我有一个场景,我使用 SnowballPorterFilterFactory 来阻止该字段。

现在它存储所有人才类型,例如:演员、舞者、歌手、模特等。

这个词干帮助我搜索使用

Actor in mumbai

Actors in mumbai

两者。

现在我想搜索

show all who sings in mumbai

如何将 singsinger 匹配??

暂时不匹配..

【问题讨论】:

    标签: solr schema solrconfig


    【解决方案1】:

    使用 Solr 管理界面的“分析”页面查看正在为 singer 执行的词干提取。这使您可以查看这两个术语的每个步骤,以及 singsinger 的最终结果。

    差异可能是因为它们实际上不是同一个词——singer 是一个主语,而 sing 是一个动词,将它们词干化为同一个词可能会产生不好的结果。在这种情况下,使用同义词列表可能会获得更好的结果。 singer 的正确词干可能只是 singer(歌手、歌手)。

    【讨论】:

    • 感谢您的评论。我通过创建自己的字段类型 text_stemming 解决了这个问题,其中我使用了 2 个过滤器工厂。 solr.SnowballPorterFilterFactorysolr.EdgeNGramFilterFactory。现在雪球将用于像 singers => singer 这样的词干提取,EdgeNGramFilterFactory 将帮助我进行部分搜索。谢谢
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-11-02
    • 2015-06-21
    相关资源
    最近更新 更多