【发布时间】:2020-08-12 12:32:16
【问题描述】:
在 Pandas 数据框中,我想将 Col1 与关键字列表进行匹配,如下所示:
关键字需要不同,位于同一列和 3 个连续行上(关键字 1 != 关键字 2 != 关键字 3,例如它们位于第 x、x+1 和 x+2 行)
我只希望关键字作为结果返回(在下面的示例中“def”被删除)
list_keywords = ['abc', 'ghi', 'jkl mnop','blabla']
Index Col1
1 abc def
2 ghi
3 jkl mnop
4 qrstu
5 vw
>>>
1 abc
2 ghi
3 jkl mnop
【问题讨论】:
-
pat = '|'.join(list_keywords); df.Col1.str.extract(f'({pat})')?
标签: string pandas dataframe intersection