【发布时间】:2025-12-23 10:35:11
【问题描述】:
我在数据框中有一列,其中包含诸如“Boris”之类的字符串,以及其他在括号之间带有额外文本的列,例如“Igor (king)”。 我只想得到一个包含 Boris / Igor / ... 的专栏(括号之间的所有内容都已删除)。 我试过这个
pattern = '(^[\w]*)(?:[w]* \()'
Test =df['column'].str.extract(pattern)
我只返回了带有括号的额外文本的名称:我得到 NaN / Igor /Nan
一些帮助?
【问题讨论】:
-
请使用 DataFrame 中的一些示例行更新问题,以便我们调试正则表达式。
-
将 re.sub 与
\([^()]+\)一起使用或使用(^\w+) \([^()]+\)并替换为组 1 regex101.com/r/7cZq00/1