【发布时间】:2013-08-08 12:48:58
【问题描述】:
我正在寻找一种以编程方式检测两个字符串之间的增量比率的方法。我可以使用字符串长度,但这并没有为大小相似但不同的输入提供太多有用的信息。 google 代码Java Diff Utils 上有一个 java diff 工具,但它自 2011 年以来一直没有更新,我不需要实际修改字符串本身。
我正在尝试使用阈值进行更改检测,例如:更新的字符串与现有字符串有 42% 的差异,您确定要继续吗?
有谁知道可以用于此的库,或者 java-diff-utils 是我唯一的选择吗?我在 apache commons 中找不到太多信息,而且谷歌搜索返回了不相关的信息。
【问题讨论】:
-
听起来你想要“Levenshtein distance”。
-
您可以使用 Apache Common 进行 Levenshtein 距离计算:commons.apache.org/proper/commons-lang/javadocs/api-3.1/org/…
-
这是关于 SO:stackoverflow.com/questions/1997750/cosine-similarity 的另一个讨论。发现这个对另一个有类似问题的人有帮助。
-
完美,您的回答很有帮助!
标签: java string compare diff delta