【问题标题】:Partial string matching部分字符串匹配
【发布时间】:2012-06-15 07:14:47
【问题描述】:

我正在制作一个供个人使用的小型系统,用于处理文件。在这个系统中,我想根据名称对文件进行分类并尽可能自动化。这导致我遇到了匹配字符串的问题。

假设我有一个名为 A category 的类别和两个名为:

  1. a.category.file
  2. lotsofgarbage.a-big-kateory.file

我需要将这些文件名与类别匹配。我想这更像是一个“他们有多相似”的分数,因为没有很好的方法来进行精确匹配。

谁能给我一个简单的好算法来解决这个问题?或者指出我的方向?

【问题讨论】:

    标签: php string-matching


    【解决方案1】:

    解决此问题的最佳方法可能是将文件名的edit distance 计算为类别名称,如果它们低于某个阈值,那么它们应该匹配。

    查看this link,显然 php 可以为你做到这一点。

    【讨论】:

      【解决方案2】:

      【讨论】:

      • 是什么让你说similar_text()更容易使用?
      • 因为也许你不需要 Levenshtein 的功能。我认为您可以使用 Similar_text 解决您的问题,但为了完整起见,您也可以使用 Lenshtein 解决。
      猜你喜欢
      • 2019-10-18
      • 2017-07-02
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-05-01
      • 1970-01-01
      • 2017-04-02
      • 2015-12-31
      相关资源
      最近更新 更多