【问题标题】:Regex for multiple patterns in pandas dataframe大熊猫数据框中多种模式的正则表达式
【发布时间】:2021-07-27 11:49:44
【问题描述】:

我在 pandas Dataframe 中有一个列,它将采用以下模式之一:

  • A1_1__Textvalue(数字可以是一位数或两位数)
  • A1__Textvalue 如何应用正则表达式模式删除Text 之前的所有字符?

我试过了

df1.replace(to_replace=[r"^A/d_/d__"], value=" ", regex=True, inplace=True)

这仅适用于初始“A”之后的一位数。它不适用于A22_2__A3_33_

【问题讨论】:

  • 你的意思是\d而不是/d

标签: python regex pandas


【解决方案1】:

\d 匹配单个数字;您需要添加像 \d+ 这样的量词来匹配多个数字(一个或多个)或像 \d{1,23} 这样的特定范围来匹配 1 到 23 位数字。

value=" " 将匹配替换为单个空格;要完全删除匹配项,请使用value=""

【讨论】:

    猜你喜欢
    • 2021-03-13
    • 2020-10-23
    • 1970-01-01
    • 2018-01-11
    • 2020-06-09
    • 2014-10-07
    • 2021-09-26
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多