【发布时间】:2026-02-22 08:50:01
【问题描述】:
我正在为弹性搜索使用语音插件过滤器。 https://github.com/elastic/elasticsearch-analysis-phonetic
创建索引时,我正在使用以下设置创建自定义过滤器。
soundex: {
type: "phonetic",
encoder: "metaphone",
replace: "true"
}
这工作正常,但创建的变音标记最大长度为 4 个字符,这给我的搜索结果增加了太多噪音。例如,我获得了用于避孕和控制的 KNTR(它是医疗数据)。
根据Unexpected results from Metaphone algorithm,底层Java API 包含一个setMaxCodeLen 值。在elasticsearch中配置时如何设置?
我想做这样的事情:
soundex: {
type: "phonetic",
encoder: "metaphone",
replace: "true",
maxcodelen: 8
}
但到目前为止,我无法确定是否可以配置编码器以增加编码令牌的最大长度。可以这样配置吗?如果有,怎么做?
【问题讨论】:
标签: elasticsearch elasticsearch-plugin metaphone