【发布时间】:2011-05-21 09:51:24
【问题描述】:
我正在尝试用字典创建一个光学字符识别系统。
事实上我还没有实现字典=)
我听说有一些基于 Levenstein 距离的简单指标,它考虑了不同符号之间的不同距离。例如。 'N' 和 'H' 彼此非常接近,并且 d("THEATRE", "TNEATRE") 应该小于 d("THEATRE", "TOEATRE") 使用基本 Levenstein 距离是不可能的。
您能帮我找到这样的指标吗?
【问题讨论】:
标签: ocr metrics levenshtein-distance