【发布时间】:2019-07-26 01:37:19
【问题描述】:
我有一个df,
inv_id
W/E FEB 8 2017
W/E JAN 24 2018
W/E MAR 11 18
W/E APR 09 17
2018 Q1
2011 Q2
inv_id 的值都是字符串。这些值具有以下格式(strftime),
%b %d %Y
%b %d %y
%b %d(non zero padded) %Y
%b %d(non zero padded) %y
%Y Q\d(regex decimal)
我在 strftime 中找不到一个月中非零填充天的指令。
我想知道如何定义模式并使用pandas 来识别它们,也许是pandas.Series.str.contains?所以结果看起来像,
inv_id is_date
W/E FEB 8 2017 True
W/E JAN 24 2018 True
W/E MAR 11 18 True
W/E APR 09 17 True
2018 Q1 True
2011 Q2 True
更新。设法处理第二种情况,
df['inv_id'].str.contains(pat=r'\b(19|20)\d{2} Q\d{1}\b', regex=True)
【问题讨论】:
-
你能在
pandas.Series.str.contains中使用正则表达式吗?
标签: python regex python-3.x pandas