【发布时间】:2011-04-04 07:44:44
【问题描述】:
我需要比较 2 个字符串并计算它们的相似度,以筛选出最相似的字符串列表。
例如。搜索“狗”会返回
- 狗
- 狗狗
- 沼泽
- 雾
- 有雾
例如。搜索“crack”会返回
- 破解
- 俏皮话
- 机架
- 杰克
- 嘎嘎
我遇到过:
你知道更多的字符串相似度算法吗?
【问题讨论】:
-
社区维基,因为您的问题没有正确答案
-
有 负载 的问题已经在处理正是这个主题。提问前请先搜索。
-
@j_random_hacker:你说很多问题?将我链接到一个演示至少一种新技术的问题?在发布我的问题之前,我已经看过你链接的那个。我不想做任何简单的排名或排序,而是一个非常准确的相似性算法,如果我搜索字典数据库,它会返回我显示的结果。
-
有很多方法可以衡量相似度,你没有确切解释你在寻找什么类型,但根据你的例子和你不喜欢 Levenshtein 距离的事实,我认为你'在某种近似子串匹配算法之后。您问题的变体是
algorithm标签下的 最受欢迎的主题。以下是一些链接:
标签: algorithm string comparison filtering ranking