【问题标题】:aggregating columns in pandas dataframes聚合熊猫数据框中的列
【发布时间】:2020-07-06 12:25:33
【问题描述】:

我正在处理德国的 covid19 数据集。将德国的 casesdeathsrecovery 的数量按月汇总后得出相同的值。有什么问题?检查dataframe 告诉我它们不一样。

covid19_data.set_index("date").resample("M").agg({"deaths": "count", 
                                                  "cases": "count", 
                                                  "recovered": "count"})


               deaths   cases   recovered
date            
2020-01-31        7       7        7
2020-02-29        76      76       76
2020-03-31      28489   28489    28489
2020-04-30      38567   38567    38567
2020-05-31      13116   13116    13116
2020-06-30      7740    7740     7740
2020-07-31        810    810      810

【问题讨论】:

  • 您可以发布您的数据样本吗?
  • 你试过.groupby(pd.TimeGrouper(freq='M'))而不是resample吗?

标签: python python-3.x pandas dataframe pandas-groupby


【解决方案1】:

如果你在聚合,你应该对这些值求和吧?

covid19_data.set_index("Date").resample("M").agg({"deaths": "sum", 
                                                  "cases": "sum", 
                                                  "recovered": "sum"})

df = df.groupby(by=pd.Grouper(key='date', freq='M')).sum()

            deaths  cases  recovered
Date
2020-01-31      67    744         15
2020-02-29      68    777         17

【讨论】:

    猜你喜欢
    • 2022-01-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-06-24
    • 1970-01-01
    • 2021-04-13
    • 1970-01-01
    • 2017-04-01
    相关资源
    最近更新 更多