【问题标题】:Python - Pandas - Replace a string from a column based on the value from other column - Dealing with substringsPython - Pandas - 根据其他列的值替换列中的字符串 - 处理子字符串
【发布时间】:2020-02-14 19:49:48
【问题描述】:

基于以下帖子: Python - Pandas - Replace a string from a column based on the value from other column

我也在做一些类似的事情,我面临着新的挑战。我使用与上一篇文章相同的示例。

包含子字符串的新挑战。

假设我有以下数据框:

我正在尝试用 col2 中的值替换 col2 上存在的值 col0。

如果我使用代码(与上一篇相同):

df['col3'] = df['col1'].replace(df['col0'].values, df['col2'].values, regex = True)

我将返回以下数据框:

我正在尝试的是以下一个:

我可以在 .values 上增加一些精度来实现这一点吗?

谢谢!

【问题讨论】:

  • 您是否尝试过设置 regex = False?

标签: python string pandas


【解决方案1】:

使用re.sub 替换DataFrame.apply 中的行:

import re

df['col3'] = df.apply(lambda x: re.sub(x['col0'],x['col2'],x['col1']), axis=1)

或者在列表理解中:

df['col3'] = [re.sub(a,c,b) for a,b,c in df[['col0','col1','col2']].to_numpy()]

print (df)
        col0                  col1     col2                col3
0    Table 1    Tablename: Table 1  Table A  Tablename: Table A
1    Table 2    Tablename: Table 2  Table B  Tablename: Table B
2  Table 2_1  Tablename: Table 2_1  Table C  Tablename: Table C

【讨论】:

    最近更新 更多