【问题标题】:Java library for fuzzy comparing text strings用于模糊比较文本字符串的 Java 库
【发布时间】:2015-07-29 14:08:01
【问题描述】:

我正在寻找一种工具,它可以比较两个文本字符串并返回一个实际上是它们相似性指标的结果(例如 95%)。它需要在支持 Java 库的平台上实现。

我最好的猜测是我需要一些模糊逻辑比较工具来进行模糊匹配,然后返回相似度。

我在这里看到了一些与模糊搜索相关的帖子,但我需要完全相反的内容——这意味着我不想设置一些参数并返回类似的条目。相反,我手头有条目,但需要从它们派生出那些相似性参数......

你能给我建议吗?非常感谢

【问题讨论】:

标签: java fuzzy-logic fuzzy-comparison


【解决方案1】:

Apache 的 StringUtils 有一个叫做 Levenshtein 距离指示器的东西。 http://commons.apache.org/proper/commons-lang/javadocs/api-3.1/org/apache/commons/lang3/StringUtils.html

Levenshstein 距离是一种基于“编辑距离”输出相似度的算法。虽然我不确定这是否“模糊”。

示例: int distance = StringUtils.getLevenshteinDistance("cat", "hat");

【讨论】:

    【解决方案2】:

    现在有一个库可以做到这一点 https://github.com/intuit/fuzzy-matcher

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2010-10-15
      • 2018-07-08
      • 1970-01-01
      • 2012-04-27
      • 2023-02-04
      • 1970-01-01
      • 1970-01-01
      • 2014-11-11
      相关资源
      最近更新 更多