聚合熊猫数据框中的列答案

【问题标题】：aggregating columns in pandas dataframes聚合熊猫数据框中的列
【发布时间】：2020-07-06 12:25:33
【问题描述】：

我正在处理德国的 covid19 数据集。将德国的 cases、deaths 和 recovery 的数量按月汇总后得出相同的值。有什么问题？检查dataframe 告诉我它们不一样。

covid19_data.set_index("date").resample("M").agg({"deaths": "count", 
                                                  "cases": "count", 
                                                  "recovered": "count"})


               deaths   cases   recovered
date            
2020-01-31        7       7        7
2020-02-29        76      76       76
2020-03-31      28489   28489    28489
2020-04-30      38567   38567    38567
2020-05-31      13116   13116    13116
2020-06-30      7740    7740     7740
2020-07-31        810    810      810

【问题讨论】：

您可以发布您的数据样本吗？
你试过.groupby(pd.TimeGrouper(freq='M'))而不是resample吗？

标签： python python-3.x pandas dataframe pandas-groupby

【解决方案1】：

如果你在聚合，你应该对这些值求和吧？

covid19_data.set_index("Date").resample("M").agg({"deaths": "sum", 
                                                  "cases": "sum", 
                                                  "recovered": "sum"})

或

df = df.groupby(by=pd.Grouper(key='date', freq='M')).sum()

            deaths  cases  recovered
Date
2020-01-31      67    744         15
2020-02-29      68    777         17

【讨论】：