【发布时间】:2013-10-02 21:03:12
【问题描述】:
我想将 uri 存储在映射中,并希望通过以下方式使其可搜索:
完全匹配(即,如果我存储:
http://stackoverflow.com/questions,然后查找术语http://stackoverflow.com/questions会检索项目。Bit like letter tokenizer 所有“单词”都应该是可搜索的。因此,搜索
questions、stackoverflow或com将返回http://stackoverflow.com/questions。正在寻找“.”或 '/' 分隔的 url 片段应该仍然可以搜索。因此,搜索
stackoverflow.com将返回http://stackoverflow.com/questions。应该不区分大小写。 (如小写)
html://、htmls://、www.等对于搜索是可选的。因此,搜索http://stackoverflow.com或stackoverflow.com将返回http://stackoverflow.com/questions。
也许解决方案应该是链接标记器或类似的东西。我对 ES 很陌生,所以这可能是一个微不足道的问题。 那么我应该使用/构建什么样的分析器来实现这个功能呢?
任何帮助将不胜感激。
【问题讨论】:
标签: elasticsearch