【发布时间】:2014-02-06 15:44:02
【问题描述】:
有人知道是否有任何编辑距离相似性实现,例如 Lucene/Solr 中的Levenshtein?谢谢
【问题讨论】:
-
你到底在暗示什么?使用为词袋/向量空间表示构建的库来索引整个蛋白质序列?
标签: solr lucene similarity
有人知道是否有任何编辑距离相似性实现,例如 Lucene/Solr 中的Levenshtein?谢谢
【问题讨论】:
标签: solr lucene similarity
是的,fuzzy queries 和 fuzzy term enumeration 使用 Levenshtein 编辑距离。
【讨论】:
Solr 具有 Levenstein 和 Jaro-Winkler 作为查询函数,这意味着您可以对它们进行排序、将它们添加到返回的文档中或使用它们来计算文档分数 http://wiki.apache.org/solr/FunctionQuery#strdist
【讨论】: