【发布时间】:2017-05-20 11:00:07
【问题描述】:
我有 200 万行英国邮政编码数据,但有些布偶在某些情况下使用了双空格,而在其他情况下使用了单空格。我需要根据邮政编码合并数据,因此它需要保持一致。
我在 pandas 中找不到简单的方法来做到这一点,但感觉应该有。有什么建议吗?
【问题讨论】:
我有 200 万行英国邮政编码数据,但有些布偶在某些情况下使用了双空格,而在其他情况下使用了单空格。我需要根据邮政编码合并数据,因此它需要保持一致。
我在 pandas 中找不到简单的方法来做到这一点,但感觉应该有。有什么建议吗?
【问题讨论】:
您可能正在寻找pd.Series.str.replace:
df.postcode = df.postcode.str.replace(' ', ' ')
【讨论】:
df.postcode = df.postcode.str.replace('\s{2,}', ' ')
这应该用一个空格替换所有多个空格
df.postcode = df.postcode.str.replace(' +', ' ')
删除开头和结尾的所有空格
df.postcode = df.postcode.str.strip()
【讨论】: