【问题标题】:ElasticSearch "Word in Word" Tokenizer/FilterElasticSearch“Word in Word”分词器/过滤器
【发布时间】:2014-04-11 13:14:42
【问题描述】:

如果您搜索“樱桃”,我正在使用雪球分析仪查找名为“樱桃”的产品。一切都像魅力一样,但现在我希望能够搜索“单词中的单词”。

例如,如果您搜索“berries”,服务器应该会找到“cranberries”、“blackberries”等。 “berry”应该会出现同样的结果。

我必须为此使用哪个过滤器/标记器?我是 ElasticSearch 的新手。

这是我现在的配置:

settings:
    index:
        analysis:
            analyzer:
                index_analyzer:
                    type: "snowball"
                    language: English

【问题讨论】:

  • 我强烈建议您在 Elasticsearch 中安装此插件或在网络服务器上运行 - github.com/polyfractal/elasticsearch-inquisitor ... 这将允许您使用 Elasticsearch 提供的各种分析器分解令牌。
  • 您是否尝试过使用用于在 Symfony 中使用 ElasticSearch 的 FOSElasticaBundle?您可以使用通配符,并且有很多品种可供归档或搜索
  • 是的,我正在为此使用 FOS Elastica。我不想使用通配符,因为它们的扩展性很差。

标签: symfony filter elasticsearch tokenize


【解决方案1】:

我为此使用了 nGram Tokenizer。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2012-12-13
    • 1970-01-01
    • 2014-11-06
    • 1970-01-01
    • 2015-10-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多