【问题标题】:Summing multiple columns with multiindex columns将多列与多索引列相加
【发布时间】:2014-08-27 03:10:49
【问题描述】:

我有一个从数据透视表创建的数据框,看起来类似于:

import pandas as pd
d = {('company1', 'False Negative'): {'April- 2012': 112.0, 'April- 2013': 370.0, 'April- 2014': 499.0, 'August- 2012': 431.0, 'August- 2013': 496.0, 'August- 2014': 221.0},
('company1', 'False Positive'): {'April- 2012': 0.0, 'April- 2013': 544.0, 'April- 2014': 50.0, 'August- 2012': 0.0, 'August- 2013': 0.0, 'August- 2014': 426.0},
('company1', 'True Positive'): {'April- 2012': 0.0, 'April- 2013': 140.0, 'April- 2014': 24.0, 'August- 2012': 0.0, 'August- 2013': 0.0,'August- 2014': 77.0},
('company2', 'False Negative'): {'April- 2012': 112.0, 'April- 2013': 370.0, 'April- 2014': 499.0, 'August- 2012': 431.0, 'August- 2013': 496.0, 'August- 2014': 221.0},
('company2', 'False Positive'): {'April- 2012': 0.0, 'April- 2013': 544.0, 'April- 2014': 50.0, 'August- 2012': 0.0, 'August- 2013': 0.0, 'August- 2014': 426.0},
('company2', 'True Positive'): {'April- 2012': 0.0, 'April- 2013': 140.0, 'April- 2014': 24.0, 'August- 2012': 0.0, 'August- 2013': 0.0,'August- 2014': 77.0},}

df = pd.DataFrame(d)

                company1    company2
                FN  FP  TP  FN  FP  TP
April- 2012     112 0   0   112 0   0
April- 2013     370 544 140 370 544 140
April- 2014     499 50  24  499 50  24
August- 2012    431 0   0   431 0   0
August- 2013    496 0   0   496 0   0
August- 2014    221 426 77  221 426 77

我希望迭代多索引列的上层以为每个公司创建一个总和列:

                company1           company2
                FN  FP  TP  SUM    FN   FP  TP   SUM
April- 2012     112 0   0   112    112  0   0    112
April- 2013     370 544 140 1054   370  544 140  1054
April- 2014     499 50  24  573    499  50  24   573
August- 2012    431 0   0   431    431  0   0    431
August- 2013    496 0   0   496    496  0   0    496
August- 2014    221 426 77  724    221  426 77   724

我事先不知道公司名称,所以需要循环

【问题讨论】:

    标签: python pandas


    【解决方案1】:

    您可以通过指定level 来计算此总和(您希望沿第一级(0级)求和,因此折叠第二级):

    In [29]: df.sum(axis=1, level=0)
    Out[29]:
                  company1  company2
    April- 2012        112       112
    April- 2013       1054      1054
    April- 2014        573       573
    August- 2012       431       431
    August- 2013       496       496
    August- 2014       724       724
    

    如果您希望它们添加到原始数据框中,如上面的示例所示,您可以在列中添加一个级别并连接:

    sums = df.sum(level=0, axis=1)
    sums.columns = pd.MultiIndex.from_product([sums.columns, ['SUM']])
    df = pd.concat([df, sums], axis=1)
    

    【讨论】:

      猜你喜欢
      • 2019-02-02
      • 2011-11-07
      • 2010-09-15
      • 2018-07-27
      • 1970-01-01
      • 1970-01-01
      • 2020-05-06
      • 1970-01-01
      相关资源
      最近更新 更多