【发布时间】:2020-07-16 11:15:47
【问题描述】:
我有一个事件数据集,每个事件都发生在特定的一天。使用 Pandas,我已经能够使用 groupby 函数将这些汇总到每月的事件计数中,然后使用 Matplotlib 绘制图表。但是,在原始数据集中,有些月份没有任何事件,因此在这样的月份中没有事件计数。因此,这样的月份不会出现在图表上,但我想以某种方式将它们的零计数包括在内
bpm2 = df2_yr1.groupby(['month_year', 'month'])['event_no'].count()
产生
month_year month
2016-01 January 9
2016-02 February 7
2016-04 April 1
2016-06 June 4
2016-07 July 1
2016-08 August 3
2016-09 September 2
2016-10 October 5
2016-11 November 17
2016-12 December 3
我一直在尝试寻找一种方法来填充由 groupby 函数生成的数据框中缺失的月份,在本示例中,3 月和 5 月的“计数”值为 0。
任何人都可以就如何实现这一点提供一些建议。我一直在尝试在月份列上执行 FFill,但收效甚微,无法弄清楚如何为缺失的月份添加相应的零值
【问题讨论】:
-
df2_yr1.groupby(['month_year', 'month'])['event_no'].size()?
标签: pandas group-by missing-data