【发布时间】:2012-01-14 13:42:33
【问题描述】:
有没有比“Levenshtein distance”算法更精确的算法?? http://en.wikipedia.org/wiki/Levenshtein_distance
【问题讨论】:
-
这取决于你如何定义准确性。
-
为什么 Levenshtein 不适合您?
-
你追求什么样的相似性?不知道自己想要什么,就不可能提出其他措施。
-
@DanielFischer Levenshtein 返回带有短单词的错误结果
例如,我正在文件中搜索与给定单词相似的单词
,我检查了文件中每个单词的算法,如果它返回的 int 小于 3 它是相似的,它适用于大词,但对于小词,当我搜索单词“one”时它不会类似的词是“core , line ,open ,move, long ,code”跨度> -
嗯,就编辑距离而言,所有的短词都比较相似,没有办法。根据长度进行缩放,正如 Regexident 建议的那样,可能会得到令人满意的结果,否则你需要找到你想要的相似度的明确规范。