【发布时间】:2020-06-22 06:08:04
【问题描述】:
我想知道elasticsearch中的相关性分数是否与couchbase有差异?
【问题讨论】:
标签: elasticsearch lucene couchbase tf-idf relevance
我想知道elasticsearch中的相关性分数是否与couchbase有差异?
【问题讨论】:
标签: elasticsearch lucene couchbase tf-idf relevance
根据this 2019 couchbase 线程,看起来他们仍在使用tf/idf 进行评分,而 Elasticsearch 曾经使用相同的算法,但现在移至BM25 algorithm for score calculation from 5.0。
注意:TF/IDF 是一种非常流行的计算相关性分数的算法,基于词频和逆文档频率,而 BM25 是最新的基于概率的即兴形式评分更多细节可以在 here 和 here 找到它们。
注意:在问题中,没有提到您比较系统相关性的目的是什么,我的两分钱是如果您正在构建一个成熟的搜索系统并且相关性对您很重要,那么您应该选择Elasticseaech 的主要功能是搜索,在选择不同的算法和不同的方式来定义评分机制方面具有很大的灵活性,这在 Couchbase 等 NoSQL 解决方案中是不存在的。
【讨论】: