【问题标题】:solr spellchecker with phonetic filters带有语音过滤器的 solr 拼写检查器
【发布时间】:2012-12-05 06:03:17
【问题描述】:

我尝试对拼写索引字段使用语音过滤器 (solr 1.4)。以下是schema.xml

中的fieldType配置
<fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100" omitNorms="false">
        <analyzer>
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.StandardFilterFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.TrimFilterFactory" />
        <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
        <filter class="solr.PhoneticFilterFactory" encoder="DoubleMetaphone" inject="true"/>
        </analyzer>
</fieldType>

但是,当使用语音过滤器时,我没有看到任何差异(拼写检查器索引的大小保持不变,更正时没有差异)。与拼写检查器一起使用时是否会忽略语音过滤器,或者我的配置有什么问题?

solrConfig.xml

  <requestHandler name="standard" class="solr.SearchHandler" default="true">
    <lst name="defaults">
      <str name="echoParams">explicit</str>
        <str name="spellcheck.collate">true</str>
        <str name="spellcheck">true</str>
        <str name="spellcheck.onlyMorePopular">false</str>
        <str name="spellcheck.extendedResults">true</str>
        <str name="spellcheck.count">5</str>
    </lst>
    <arr name="last-components">
        <str>spellcheck</str>
    </arr>
  </requestHandler>

  <searchComponent name="spellcheck" class="solr.SpellCheckComponent">
    <str name="queryAnalyzerFieldType">textSpell</str>
    <lst name="spellchecker">
      <str name="name">default</str>
      <str name="field">loc_name_texts</str>
      <str name="spellcheckIndexDir">./spellchecker</str>
      <str name="buildOnCommit">true</str>
    </lst>
  </searchComponent>

更新: 我最初错误地配置了过滤器,所以一直在使用 WhitespaceTokenizer。我现在已经更正了。但是,当使用语音过滤器时,solr 返回转换后的数据(变音位)。有没有办法将内容存储为字段的一部分?

【问题讨论】:

    标签: solr


    【解决方案1】:

    solr 中的语音过滤器用于返回更正的建议。即使查询拼写错误,它们也用于匹配文档。

    拼写检查组件用于返回更正的建议,但仅适用于包含整个单词的字段,而不适用于拼音字段。

    【讨论】:

      【解决方案2】:

      尝试将“拼写检查”元素更改为此

          <bool name="spellcheck">true</bool>
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2012-02-18
        • 2013-09-09
        • 2012-09-02
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多