【发布时间】:2021-01-02 05:46:54
【问题描述】:
我有一个包含许多相似列名(基本上是拼写错误的单词)的数据,例如:
apple grapes apples bana apyles grayes graph banana
在这里,我想合并列“apple, apples, apyles”,然后是“grapes, grayes, graph”和“bana,banana”。我该怎么做?
*编辑评论:
问。当你说“结合”时,你是什么意思。可以包含样本输入和输出吗?
回答。
输入
apple grapes apples bana apyles grayes graph banana
1 2 3 4 5 6 7 8
输出
apple grape banana
9 15 12
【问题讨论】:
-
你试过模糊匹配吗?
-
@Ukrainian-serge 我刚刚尝试过,我基本上希望将任何具有 90% (fuzz.ratio()) 的列合并/求和。但是我怎样才能将它应用到每一列呢?
标签: python pandas fuzzywuzzy