【发布时间】:2020-10-29 06:25:26
【问题描述】:
我有一个非常长的数据集,它存储为数据框。我正在查看的列称为“国家/地区”。这个专栏里面有很多国家。问题是我想将各种值更改为“美国”。 我试图改变的价值观是 我们 美国 美国 等等。 有太多的变化和错别字(超过 100 个)让我无法阅读。有没有更简单的方法来改变这些值?由于数据集中还有其他国家/地区,因此我不能将所有值都更改为 USA
【问题讨论】:
-
你试过用fuzzywuzzy进行模糊匹配吗?我会开始尝试将 US、USA、United States 和那些值与 USA 的地图相匹配,或者你拥有的任何 verspinn。