【问题标题】:Retrieving the span of a fuzzy match检索模糊匹配的跨度
【发布时间】:2021-12-24 05:33:59
【问题描述】:

我正在尝试在大文本中模糊搜索短文本。

常见的python库,例如fuzzywuzzy和rapidfuzz,都支持“partial_ratio”函数,但是只返回一个分数,而不是匹配的位置。

是否有一些库或函数可以用来获取模糊匹配的位置(类似于正则表达式匹配的 span 方法)?

【问题讨论】:

    标签: python-3.x fuzzy-search


    【解决方案1】:

    我查看了fuzzywuzzy 并注意到找到了index of a match is an open issueRapidFuzz 也是如此。

    这促使我“(类似于正则表达式匹配的 span 方法)”围绕该方法做一些研究。在我的研究中,我发现了 Python 包regex。该软件包的自述文件谈到了fuzzy matching。我没有用过这个包,但它似乎对解决你的用例很有用。

    【讨论】:

      猜你喜欢
      • 2020-11-01
      • 2011-03-13
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-08-13
      • 2016-02-11
      相关资源
      最近更新 更多