【问题标题】:Solr Search for non-alphaneric characactersSolr 搜索非字母字符
【发布时间】:2011-04-16 01:55:14
【问题描述】:

我想知道设置 solr 架构以在数据中搜索“#10”之类的内容的最佳方法。

谢谢。

【问题讨论】:

    标签: schema solr


    【解决方案1】:

    您的问题实际上有很多问题,我会分解如下:

    • 我需要搜索哪些数据字段?
    • 我将如何搜索这些字段?
    • 我需要从搜索请求中检索哪些数据?

    如果不回答这些问题,就无法真正确定您的架构设计。

    这些问题是一个更长的话题,所以我不打算在这里讨论那些令人作呕的东西(阅读 Solr 文档以获得更好的理解。)

    在处理特殊字符时,您关心的是索引中的分析步骤,因为您希望以一种允许您在逻辑上检索它们的方式存储您的术语。分析器(可以)使用各种标记化策略将词干修改应用于索引内容。

    分析器是关于分解术语文本的;您需要确保您的特殊字符在分析中幸存下来并最终被索引。我将开始使用 WhitespaceAnalyzer 来查看,它将源内容中的术语保留在索引中的确切状态。 Solr wiki page on Analyzers 会让您了解这些功能有多少。

    【讨论】:

    • 谢谢,感谢详细的回答。前几天我尝试了 WhitespaceAnalyzer,它实现了我想要做的事情。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-11-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多