【问题标题】:How to index special characters in Solr如何在 Solr 中索引特殊字符
【发布时间】:2018-07-10 05:38:27
【问题描述】:

我有一个特殊字符列表,需要对其进行索引。如何在我的 Solr 搜索中包含这些字符? Solr的Schema.xml文件需要做哪些配置?

人物列表:

!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~

我们将不胜感激。谢谢!

【问题讨论】:

    标签: solr opentext


    【解决方案1】:

    使用这些值来查询或索引它们没有什么特别的;但您必须决定如何使用它们。

    如果您有一个在单词边界上进行标记的 Tokenizer,这些特殊字符将意味着 Tokenizer 可以决定它分隔两个标记,因此不会对其进行索引。

    如果您使用不对这些字符做任何特殊处理的分词器,它们将与任何其他字符一样可用。如果您的库不为您执行此操作,您将需要转义它们 - 但这取决于您查询 Solr 的方式。

    string 字段不会对输入标记执行任何操作,并且任何值都会将其特殊字符保留在一个标记中,而无需进一步拆分。

    【讨论】:

    • 要求是“在查询时我不应该转义任何这些字符。”转义应该从配置端发生。这可能吗?
    • 没有。字符具有特殊含义,具体取决于您希望它们的含义。 用户不必考虑这一点,因为您将在将查询发送到 Solr 时在中间层进行适当的转义。
    猜你喜欢
    • 2018-08-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-10-24
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多