【发布时间】:2011-04-16 01:55:14
【问题描述】:
我想知道设置 solr 架构以在数据中搜索“#10”之类的内容的最佳方法。
谢谢。
【问题讨论】:
我想知道设置 solr 架构以在数据中搜索“#10”之类的内容的最佳方法。
谢谢。
【问题讨论】:
您的问题实际上有很多问题,我会分解如下:
如果不回答这些问题,就无法真正确定您的架构设计。
这些问题是一个更长的话题,所以我不打算在这里讨论那些令人作呕的东西(阅读 Solr 文档以获得更好的理解。)
在处理特殊字符时,您关心的是索引中的分析步骤,因为您希望以一种允许您在逻辑上检索它们的方式存储您的术语。分析器(可以)使用各种标记化策略将词干修改应用于索引内容。
分析器是关于分解术语文本的;您需要确保您的特殊字符在分析中幸存下来并最终被索引。我将开始使用 WhitespaceAnalyzer 来查看,它将源内容中的术语保留在索引中的确切状态。 Solr wiki page on Analyzers 会让您了解这些功能有多少。
【讨论】: