【发布时间】:2019-08-31 22:28:54
【问题描述】:
我有一个 DataFrame,其中一列是字符串的行,如下所示:
Received value 126;AOC;H3498XX from 602
Received value 101;KYL;0IMMM0432 from 229
我想删除(或不替换)第二个分号之后的部分,使其看起来像
Received value 126;AOC; from 602
但是我要删除的这部分将有不同且不可预测的长度(总是 A-Z 和 0-9 的组合)。分号和 froms 将始终存在以供参考。
我正在尝试通过研究此链接来使用正则表达式:https://docs.python.org/3/library/re.html
import re
for row in df[‘column’]:
row = re.sub(‘;[A-Z0-9] from’ , ‘; from’, row)
我认为 [A-Z0-9] 未能包含我想要的可变长度方面。
【问题讨论】:
-
print(s.replace(s.split(";",2)[-1].split()[0],''))?