【发布时间】:2021-09-26 18:08:05
【问题描述】:
我有一份公司名称列表,但其中有拼写错误和变体。我怎样才能最好地解决这个问题,以便每个公司都有一致的命名约定(以后groupby、sort_value 等)?
pd.DataFrame({'Company': ['Disney','Dinsey', 'Walt Disney','General Motors','General Motor','GM','GE','General Electric','J.P. Morgan','JP Morgan']})
【问题讨论】:
标签: pandas group-by fuzzywuzzy