【发布时间】:2016-06-20 04:24:39
【问题描述】:
我想对基本编辑距离算法进行修改。即加权编辑距离。 (上下文:尝试创建搜索引擎时出现拼写错误)
例如,将 s 替换为 a 的成本将低于将 s 替换为 p em>。
使用 DP 的算法需要一个简单的改变,即,
d[i, j] := minimum(d[i-1, j] + 1, // deletion
d[i, j-1] + 1, // insertion
d[i-1, j-1] + substitutionCost) // substitution
我查看了,但在任何地方都找不到这样的矩阵,它可以为所有字母对提供适当的 substitutionCost。我的意思是,我希望成本基于键盘上字母之间的距离。还没有人明确定义过这样的矩阵吗?
【问题讨论】:
-
投票结束为题外话。问题不在于编程部分,而在于“我在哪里可以找到替代成本矩阵?”
-
对不起!那么我在哪里发布这个问题呢?
-
我不知道,也许是reddit
标签: matrix dynamic-programming levenshtein-distance edit-distance