【问题标题】:How to applying regex to replace values如何应用正则表达式替换值
【发布时间】:2021-12-07 01:37:05
【问题描述】:

我有一个这样的数据框省:

province = {'province':['Prov. Jawa Barat', 'JAWA BARAT', 'Prop. Jawa Barat', 'Prov. Sumarta Selatan', 'SUMARTA SELATAN', 'Prop. Sumatra Selatan'],
            'city':['Bandung', 'Bogor', 'Cimahi', 'Palembang', 'Solo', 'Cilacap']}

df_prov = pd.DataFrame(province)

但是,省份的名称没有相同的规则。那么如何将前缀为'Prov'和'Prop'的省份名称改为JAWA BARAT和SUMARTA SELATAN呢?

对不起,我的英语不太好 谢谢

【问题讨论】:

    标签: python regex pandas replace


    【解决方案1】:

    您可以尝试简单地删除前缀并将剩余部分大写:

    df_prov["province"] = df_prov["province"].str.replace(r'^Pro[pv]\. ', '').str.upper()
    

    【讨论】:

    • 但是我大概有34个这样的省名,一个一个改很累。
    • @InsanCahya 如果您确定以Prop.Prov. 开头的所有 省名称需要去掉前缀并将其余部分大写,然后查看我更新的答案。否则,我们需要一份您想要定位的所有省份的列表。
    猜你喜欢
    • 2014-04-30
    • 1970-01-01
    • 2012-02-12
    • 1970-01-01
    • 2019-01-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多