【发布时间】:2020-01-07 10:24:29
【问题描述】:
我想从匹配数据中获取比率,我有大量数据,我想使用 python 进行匹配过程。例如 : 我比较姓名和年龄的组合
Name Age
Jo 15
Ame 10
Rio 23
Joe 15
比较将是:
Jo15 will be compared with Ame10, Rio23, Joe15
Ame will be compared with Rio23, Joe15 and so on
FuzzyWuzzy 和 Levenshtein 之间哪个更好? 或者有什么想法可以让数据匹配得更快?
【问题讨论】:
-
这似乎是同一件事github.com/seatgeek/fuzzywuzzy
-
如果你有大量数据,余弦相似度加上矢量化器会更快,也许更有效
标签: python-3.x string-matching fuzzywuzzy