【发布时间】:2026-01-24 15:45:01
【问题描述】:
我正在使用 pandas 读取 csv 列,其中每一行的格式如下:
IP: XXX:XX:XX:XXX
为了摆脱IP: 前缀,我在事后编辑该列:
logs['ip'] = logs['ip'].str[4:]
有没有办法在read_csv 中执行此操作,可能使用正则表达式,以避免后期计算?
更新 | 考虑这种情况,其中有多个列具有这些前缀 - 有没有更好的方法?
logs['mac'] = logs['mac'].str[5:]
logs['id'] = logs['id'].str[4:]
logs['lan'] = logs['lan'].str[5:]
logs['ip'] = logs['ip'].str[4:]
【问题讨论】:
-
我不这么认为,IMO 我认为这是最好的方法,因为它是矢量化的并且应该很快
-
你能举例说明有什么以及你想用正则表达式搜索什么吗?
-
@apgp88 我用更具体的场景更新了这个问题。
标签: python regex csv pandas data-cleaning