【发布时间】:2021-11-12 01:05:35
【问题描述】:
我有一个日期时间数据集和在这些时间发生的特定事件。数据集如下所示:
现在我想要的是拥有一个包含 2 列的新数据集。第一个是周频率的日期,第二个是上图中这周发生了多少事件,例如会是这样的:
Dates Events
27-12-2015 5
3 - 1-2016 6
【问题讨论】:
标签: python-3.x pandas time-series
我有一个日期时间数据集和在这些时间发生的特定事件。数据集如下所示:
现在我想要的是拥有一个包含 2 列的新数据集。第一个是周频率的日期,第二个是上图中这周发生了多少事件,例如会是这样的:
Dates Events
27-12-2015 5
3 - 1-2016 6
【问题讨论】:
标签: python-3.x pandas time-series
使用DataFrame.resample 或Grouper:
df['date_raised'] = pd.to_datetime(df['date_raised'])
df.resample('W', on='date_raised').size().reset_index(name='Events')
或者:
df.groupby(pd.Grouper(freq='W', key='date_raised')).size().reset_index(name='Events')
【讨论】:
df.groupby([pd.Grouper(freq='W', key='date_raised'), 'primary_industry']).size().reset_index(name='Events')