【发布时间】:2021-07-15 21:35:03
【问题描述】:
假设我们有两个字符串:
- ccttgg
- gacgct
这两个字符串的编辑距离是6。
可能的子串是:
- cctt--
- gacg--
他们的编辑距离是 4。
与原来的两个字符串相等的其余部分是:
- ----gg
- ----ct
他们的编辑距离是2。
所以4+2=6,就是原来的编辑距离。
这种假设总是正确的吗?
如果不是,有没有办法使用两个字符串的子字符串的编辑距离来计算两个字符串之间的编辑距离?
编辑:为了更清楚,我对编辑距离的定义是 Levenshtein 距离,如果字符不相同,则插入、删除和替换的成本为 1,如果字符相等,则为 0。 我不考虑使用换位的 Damerau 距离。
【问题讨论】:
标签: levenshtein-distance edit-distance