【发布时间】:2022-01-21 14:33:19
【问题描述】:
我在 pandas 中有 2 列,数据看起来像这样。
code fx category
AXD AXDG.R cat1
AXF AXDG_e.FE cat1
333 333.R cat1
....
还有其他类别,但我只对cat1感兴趣。
我想合并code 列中的所有内容,以及fx 列中. 之后的所有内容,并用新组合替换代码列而不影响其他行。
code fx category
AXD.R AXDG.R cat1
AXF.FE AXDG_e.FE cat1
333.R 333.R cat1
.....
这是我的代码,我想我必须使用正则表达式,但我不确定如何以这种方式组合它。
df.loc[df['category']== 'cat1', 'code'] = df[df['category'] == 'cat1']['code'].str.replace(r'[a-z](?=\.)', '', regex=True).str.replace(r'_?(?=\.)','', regex=True).str.replace(r'G(?=\.)', '', regex=True)
我也不确定如何选择第二列。任何帮助将不胜感激。
【问题讨论】: