【问题标题】:Solr mixed up "television" and "televisions"Solr 混淆了“电视”和“电视”
【发布时间】:2018-10-04 18:14:36
【问题描述】:

我有一堆文档,每个文档都有一堆随机单词。 Solr 输出对于 televisiontelevisions (Results for televisions) 这两个词都搞砸了...即当我搜索 televisions 时,它会为我提供 televisiontelevisions 的结果。这只是关于television这个词及其复数; Solr 适用于其他单词及其复数形式。例如,它适用于 carcars (Results for car)。可能是什么问题?

【问题讨论】:

  • 字段的定义是什么?
  • 我搜索所有字段,它们基本上是默认字段。

标签: solr stemming


【解决方案1】:

Solr 提供开箱即用的同义词支持,对于 99.99% 的情况,您必须定义哪些词是同义词。两个例外是“电视”和“千兆字节”这两个词,因为它们已经在 Solr 使用的默认 synonyms.txt 文件中定义。

您可以在核心的conf 文件夹中看到这个:

$ cat /path/to/solr/server/solr/your-core/conf/synonyms.txt

# Some synonym groups specific to this example
GB,gib,gigabyte,gigabytes
MB,mib,megabyte,megabytes
Television, Televisions, TV, TVs

注意它是如何定义 TV、Television、Televisions 和 TVs 是同义词的。

您也可以在此处阅读更多相关信息: https://github.com/hectorcorrea/solr-for-newbies/blob/master/tutorial.md#synonyms

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2014-10-15
    • 2016-05-27
    • 2013-11-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多