【发布时间】:2015-10-15 11:32:57
【问题描述】:
我有类似的数据
Mega Mall
Mega Malls
L & T Gate 6
L & T Gate 5
L & T Gate 2
Megas Mall
Mega Mwll
现在我想清理它。我使用编辑距离 1 采用了编辑距离方法,并处理了 Mega Mall 案例。缺点是它也删除了 L & T Gate 5,2 [我保留了第一个条目]。有什么办法可以处理这个问题,不删除这些案例和处理错别字等。
【问题讨论】:
标签: string algorithm levenshtein-distance fuzzy-search