【发布时间】:2018-07-10 05:38:27
【问题描述】:
我有一个特殊字符列表,需要对其进行索引。如何在我的 Solr 搜索中包含这些字符? Solr的Schema.xml文件需要做哪些配置?
人物列表:
!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
我们将不胜感激。谢谢!
【问题讨论】:
我有一个特殊字符列表,需要对其进行索引。如何在我的 Solr 搜索中包含这些字符? Solr的Schema.xml文件需要做哪些配置?
人物列表:
!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
我们将不胜感激。谢谢!
【问题讨论】:
使用这些值来查询或索引它们没有什么特别的;但您必须决定如何使用它们。
如果您有一个在单词边界上进行标记的 Tokenizer,这些特殊字符将意味着 Tokenizer 可以决定它分隔两个标记,因此不会对其进行索引。
如果您使用不对这些字符做任何特殊处理的分词器,它们将与任何其他字符一样可用。如果您的库不为您执行此操作,您将需要转义它们 - 但这取决于您查询 Solr 的方式。
string 字段不会对输入标记执行任何操作,并且任何值都会将其特殊字符保留在一个标记中,而无需进一步拆分。
【讨论】: