【发布时间】:2013-05-21 07:07:25
【问题描述】:
这个问题可能会被报告重复,但我做了很多研究,没有得到任何令人满意的结果,所以我认为我最好准确地问它。
在我的项目中,我需要匹配地址字符串。我已经实现了几种字符串搜索算法,例如 Soundex、Levenshtein 距离、Damerau–Levenshtein 距离、模糊搜索、字符频率匹配等。但是对于 St. 和 Street、Jr. 和 Junior 等字符串之间的搜索结果并不令人满意。想过用 Streets 替换所有 St.,但这会导致像“St.”这样的地址出现问题。保罗街”。 我该怎么办?
【问题讨论】:
-
仅在地址末尾将 St. 替换为 Street。
-
行不通,在像“第二街,某些地区”这样的情况下,我在数据库中有很多这样的地址。无论如何,谢谢,但我需要更聪明的技术
标签: string algorithm string-matching