【问题标题】:Removing numbers from strings in a pandas dataframe [duplicate]从熊猫数据框中的字符串中删除数字[重复]
【发布时间】:2019-01-28 20:53:01
【问题描述】:

我在 pandas 中有一个数据框,在一列中有很多带有数字的名称。如何删除号码?例如:Andorra14:

energy['Country'].head()  
1.       Afghanistan   
2.           Albania   
3.           Algeria   
4.    American Samoa    
5.         Andorra14   
Name: Country, dtype: object

【问题讨论】:

标签: python pandas


【解决方案1】:

我的猜测是使用正则表达式:

energy['Country'] = energy['Country'].str.replace(r'\d+','')

发件人:

0    Afghani1stan
1        Alb3ania
2         Algeria
3  American Samoa
4       Andorra14

我明白了:

0     Afghanistan
1         Albania
2         Algeria
3  American Samoa
4         Andorra

【讨论】:

    【解决方案2】:

    str 属性是你的朋友:

    In [10]: energy['Country'].str.replace('\d+', '')
    Out[10]: 
    0       Afghanistan
    1           Albania
    2           Algeria
    3    American Samoa
    4           Andorra
    Name: Country, dtype: object
    

    【讨论】:

    • 请注意您的数字不在使用str.replace的两个单词之间:如果您有American12Samoa,它将变为AmericanSamoa。如果你用空格替换,那么你可以有 'Andorra12''Andorra '
    猜你喜欢
    • 2016-11-12
    • 1970-01-01
    • 2019-03-06
    • 2018-03-23
    • 2021-08-12
    • 2017-06-02
    • 1970-01-01
    • 2017-07-27
    • 2018-10-25
    相关资源
    最近更新 更多