【问题标题】:Convert Levenshtein Distance to Error Rate将 Levenshtein 距离转换为错误率
【发布时间】:2014-02-25 15:18:48
【问题描述】:

他们是一种将列文斯坦距离转换为错误率的方法吗?

错误率是序列中不完全相同的部分。

【问题讨论】:

    标签: machine-learning computer-science levenshtein-distance information-theory


    【解决方案1】:

    您的意思是要将 Levenshtein 距离标准化为 [0, 1]?那是

    d(a,b) / max(len(a), len(b))
    

    分母是 Levenshtein 距离的上限,所以这给出了一个介于 0 和 1 之间的数字。证明:假设(不失一般性)len(a) > len(b),那么你总是可以通过替换len(b)字符并删除len(a) - len(b)a转换为b,总共len(a) - len(b) + len(b) = len(a)操作。

    【讨论】: