【发布时间】:2021-07-06 12:46:56
【问题描述】:
我正在尝试对 R 和 Python 使用字符串模糊匹配。 我实际上使用了两个包:
-
stringdist来自 R -
fuzzywuzzy来自 Python
当我在 R 上尝试amatch("PARI", c("HELLO", "WORLD"), maxDist = 2) 时,我得到NA 结果,这很直观。
但是当我用 Python 尝试同样的事情时:process.extract("PARI", ["HELLO", "WORLD"], limit = 2),我得到了[('world', 22), ('HELLO', 0)]
谁能告诉我为什么我有一个 22 作为 "PARI" 和 "WORLD" 之间的比率匹配? 我怎样才能得到与 R 相同的结果? 提前致谢
【问题讨论】: