【发布时间】:2020-09-30 14:12:36
【问题描述】:
对于 pandas 数据框中的一列,我想完整地删除任何数字,无论是紧跟“gb”或“mb”还是中间有空格。 IE。删除诸如“500 gb”和“500mb”之类的字符串。
Column_To_Fix
0 coolblue 100gb
1 connector 500 mb for thing
2 5gb for user
3 load 800 mb
4 1000 add-on
5 20 gb
下面的函数只适用于第0行和第2行,不知道如何添加模式的空间要求:
pat = '(^|\s)\d+(gb|mb)($|\s)'
df['Column_To_Fix'].str.lower().replace(pat, ' ', regex=True)
期望的输出:
Column_To_Fix
0 coolblue
1 connector for thing
2 for user
3 load
4 1000 add-on
5
【问题讨论】:
-
数字
'0'到'5'在文本的第一列中吗?如果不是,我建议你删除它们。
标签: python regex pandas regexp-replace