【发布时间】:2016-05-27 05:55:53
【问题描述】:
所以,我有一个 Solr 实例,它使用 StandardTokenizer(以及 ClassicFilterfactory、LowercaseFilterFactory 和 Stopfilterfactory)处理输入和查询。
在我的索引中有一些文件名用下划线分隔(例如some_indexed_file.jpg)。
我注意到,如果我查询some_indexed_file.jpg,我会正确返回我要查找的文件。
但是,如果我另外搜索some_indexed_file.jp*(带有星号,我假设它充当通配符),据我的理解应该会产生类似的结果,我不会得到任何结果。
知道发生了什么:我想我对 solr 处理查询的方式有误解?
编辑:根据要求,这里是架构 XML 配置条目:
<fieldType name="default" class="solr.TextField">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.ClassicFilterFactory" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.StopFilterFactory" />
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.ClassicFilterFactory" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.StopFilterFactory" />
</analyzer>
</fieldType>
<field name="filename" type="default" multiValued="true" omitNorms="false" termVectors="false"/>
【问题讨论】:
-
您能否将以下内容添加到您的问题中:schema.xml 的摘录以及您在示例中存储和/或搜索文件名的字段的
和 定义?