【问题标题】:How cosine similarity differs from Okapi BM25?余弦相似度与 Okapi BM25 有何不同?
【发布时间】:2019-08-06 01:07:14
【问题描述】:

我正在使用弹性搜索进行研究。我打算使用余弦相似度,但我注意到它不可用,而是我们将 BM25 作为默认评分函数。

这是有原因的吗?余弦相似度不适合查询文档吗?为什么选择BM25作为默认值? 谢谢

【问题讨论】:

    标签: elasticsearch nlp information-retrieval cosine-similarity


    【解决方案1】:

    Longtime elasticsearch 使用 TF/IDF 算法来查找查询中的相似性。但是之前的数字版本改为BM25,因为效率更高。您可以阅读the documentation 中的信息。 And good article explains what is elastic search and how to the similarity in ES.

    您还可以为 elasticsearch 编写自定义算法。 Here a good article about how to do.

    【讨论】:

      猜你喜欢
      • 2020-08-12
      • 2017-12-12
      • 1970-01-01
      • 1970-01-01
      • 2011-01-01
      • 2017-04-04
      • 2018-02-19
      • 1970-01-01
      相关资源
      最近更新 更多