【发布时间】:2019-12-05 04:16:23
【问题描述】:
我们有一个 ES 索引,它有一个将其数据存储为数组的字段。在这个字段中,我们包括原始文本,加上没有任何标点符号、特殊字符等的文本。问题是,在该字段上搜索时,多个值似乎歪曲了分数。
例如,如果我们搜索术语“up”,则包含数组 ['up, up and away', 'up up and away'] 的文档使用 multi_match 得分更高(我们之所以使用它是因为我们可以搜索多个字段)而不是具有数组的文档,只需 ['up']。
最后,我想我正在寻找的是一个分数,它模拟计算数组中每个项目的分数并返回最高值。我相信在这种情况下,将“up”与“Up”和“Up, Up and Away”进行比较会给我的“Up”分数更高。
根据我的研究,我相信我可能需要在该领域进行自定义评分...?如果这是真的,我是否将 "score_mode": "max" 视为我想要的?
【问题讨论】:
标签: elasticsearch