【发布时间】:2017-05-19 12:03:09
【问题描述】:
我已经看到很多关于这个主题的问答,但没有一个包含我正在寻找的输出类型。任何对此的智慧之言将不胜感激!
- 我有 2 个列表...两个列表都包含 1 列,由 Full Name|University 组成(即名称和大学,由竖线连接并分隔)
- 由于昵称和大学缩写,并不总是完全匹配。我想将列表 1 中的每条记录与列表 2 中的每条记录进行比较,并找到最接近的匹配项。
- 然后我想生成一个包含 3 列的输出文件:列表 1 中的每个项目、列表 2 中最接近的匹配项以及匹配百分比。
有没有人可以分享示例代码?谢谢!
【问题讨论】:
-
如果不显示一些您尝试过的代码,您可能不会获得太多帮助,但 fuzzywuzzy 是一个很好的库。
-
尝试解释 Python 类型的问题,即 columns 和 records 不是 Python 数据类型和声音域特定的。正如 Jack 推荐的那样,一些代码示例总是很好的。
-
我是 Python 的超级新手——我为此尝试的任何代码都被炸毁了,所以我想我会在这里问。请原谅我的菜鸟命名约定。
标签: python fuzzy-search fuzzy-logic