【发布时间】:2019-04-27 21:30:05
【问题描述】:
我正在尝试提取特殊字符> 和单词模式.myword 之间的所有字符(通常是多个单词,包括空格)。在我的熊猫数据框中。
我尝试了以下方法,它只将一个词附加到.myword:
df['my_column'] = df['text'].str.findall(r'(\w+.myword)')
一些字符串示例:
str1 = 123abc >I want this1.myword #extract I want this1.myword
str2 = 123<>I want this2.myword<> #extract I want this2.myword
【问题讨论】:
-
一般
>(.*?)\.myword或(?<=>).+?(?=\.myword)