【发布时间】:2017-11-12 00:31:39
【问题描述】:
我有一个包含 3 列的数据框。 时间代表各个月份的每一天。我要做的是每天获取“计数”值并每月平均,并为每个国家/地区执行此操作。输出必须是数据框的形式。
当前数据:
Time Country Count
2017-01-01 us 7827
2017-01-02 us 7748
2017-01-03 us 7653
..
..
2017-01-30 us 5432
2017-01-31 us 2942
2017-01-01 us 5829
2017-01-02 ca 9843
2017-01-03 ca 7845
..
..
2017-01-30 ca 8654
2017-01-31 ca 8534
Desire output(虚拟数据,数字不代表上面的DF):
Time Country Monthly Average
Jan 2017 us 6873
Feb 2017 us 8875
..
..
Nov 2017 us 9614
Dec 2017 us 2475
Jan 2017 ca 1878
Feb 2017 ca 4775
..
..
Nov 2017 ca 7643
Dec 2017 ca 9441
【问题讨论】:
-
You Count 列令人困惑。它是原始数据框的列还是 groupby 的结果列?另外,我不确定为什么需要计数和平均值。可以直接按平均值聚合。
-
它应该来自原始数据框。基本上将每个月的所有值相加,然后取平均值。
标签: python pandas dataframe grouping