【问题标题】:synonyms containing multiple words包含多个单词的同义词
【发布时间】:2012-03-19 14:06:45
【问题描述】:

我正在使用 solr 作为搜索引擎。

我想将一些单词或短语映射到其他东西,例如:

Drama and Theatre Studies=>drama

除非是一个词,否则使用同义词对我没有用。

最好的方法是什么?

【问题讨论】:

  • 你检查了wiki.apache.org/solr/…的同义词文件格式
  • 我确实检查了文件,上面写着“请记住,虽然 SynonymFilter 很乐意处理包含多个单词的同义词”

标签: java solr lucene search-engine


【解决方案1】:

同义词文件中的术语和短语术语应以逗号分隔。

可能由于小写/大写的不同,短语的映射不起作用。检查solr.LowerCaseFilterFactorysolr.SynonymFilterFactory 的顺序。 鉴于您的同义词文件都是小写的,您应该先设置LowerCaseFilterFactory,然后再设置SynonymFilterFactory

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-12-11
    • 1970-01-01
    • 1970-01-01
    • 2016-05-15
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多