【发布时间】:2012-08-23 14:36:13
【问题描述】:
我有 2 个版本的 solr 在我的机器上工作。说SolrVer1和SolrVer2
SolrVer1 已应用,下面是字段类型text_en_splitting 的词干提取方法
<filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt" ignoreCase="true"/>
<filter class="solr.PorterStemFilterFactory" ignoreCase="true"/>
SolrVer2 已应用,下面是字段类型text_en_splitting 的词干提取方法
<filter class="solr.SnowballPorterFilterFactory" language="English" protected="protwords.txt"/>
它在常规搜索中几乎相同,但是在使用通配符搜索时,通配符搜索不会在SolrVer1 上给出符合语法的结果
就像使用 ray* 搜索一样,SolrVer1 与 SolrVer2 相比返回的数据非常少。当我观察结果时,我发现SolrVer1 不返回只有ray 和rays 的数据。
我不知道应该在哪里使用 SnowballPorterFilterFactory 以及应该在哪里使用 PorterStemFilterFactory 。它们的优缺点是什么?
任何人都可以知道这种行为吗?
谢谢
【问题讨论】: