【发布时间】:2018-07-27 13:58:01
【问题描述】:
您好,我在与 Pandas 打交道时遇到了麻烦。我正在尝试对多索引 Dataframe 上的重复行求和。
我尝试了 df.groupby(level=[0,1]).sum() ,也尝试了 df.stack().reset_index().groupby(['year', 'product']).sum() 和其他一些,但我无法让它工作。
我还想为每个给定年份添加每个独特的产品,如果它们未列出,则给它们一个 0 值。
示例:具有多索引和 3 种不同产品(A、B、C)的数据框:
volume1 volume2
year product
2010 A 10 12
A 7 3
B 7 7
2011 A 10 10
B 7 6
C 5 5
预期输出:如果给定年份有重复的产品,那么我们将它们相加。 如果有一个产品一年没有上市,我们会创建一个新的全为 0 的行。
volume1 volume2
year product
2010 A 17 15
B 7 7
C 0 0
2011 A 10 10
B 7 6
C 5 5
有什么想法吗?谢谢
【问题讨论】:
标签: python pandas dataframe multi-index