【发布时间】:2014-06-09 14:53:59
【问题描述】:
我想计算在 elasticsearch 中索引的两个文档之间的相似度。我知道它可以使用术语向量在 lucene 中完成。直接的方法是什么?
我发现有一个相似性模块正是这样做的: http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/index-modules-similarity.html
如何将它集成到我的系统中?我正在使用 pyelasticsearch 调用 elasticsearch 命令,但如果需要,我愿意使用 REST api 进行相似性。
【问题讨论】:
-
Javanna 有一篇很棒的文章,介绍了 MLT 查询和 MLT API 之间的区别。这应该有助于澄清差异并为您提供有关其工作原理的更多信息。 stackoverflow.com/a/15320512/3075507
-
希望我的回答对您有所帮助,有任何问题都可以提出来。
-
@Michaelatqbox.io 答案并没有解决我面临的问题。 MLT 查询和 MLT api 都可以帮助您搜索“关闭”文档。我想测量两个文档之间的紧密度。应该看到第一个问题比较难,但是我没有办法解决第二个问题。期待你的答复。问题也写在这里:grokbase.com/t/gg/elasticsearch/131b9aa8xg/…
标签: search solr lucene elasticsearch mlt