【发布时间】:2017-06-01 05:24:12
【问题描述】:
考虑这个例子:
>> from fuzzywuzzy import process
>> choices = ['account', 'update', 'query']
>> process.extract('u', choices)
[('account', 90), ('update', 90), ('query', 90)]
在上述情况下,对于给定字符串,account 排名高于 update,这让我的最终用户感到困惑。在这种情况下,由于列表顺序,account 恰好被任意放在前面,因为所有匹配项共享相同的分数。但是,我会想象 update 会获得更高的分数,这仅仅是因为字符 u 出现在字符串的前面。
这是一个概念错误还是我在这里没有使用正确的记分器?
【问题讨论】:
标签: python fuzzy-search fuzzywuzzy