【发布时间】:2018-09-29 06:37:32
【问题描述】:
我有一个以下格式的现有数据框(我们称之为df):
A B C D
0 1 2 1 4
1 3 0 2 2
2 1 5 3 1
列名是从具有以下形式的电子表格中提取的(我们称之为cat_df):
current category
broader category
X A
Y B
Y C
Z D
首先,我想添加一个更高级别的索引,使 df 看起来像这样:
X Y Z
A B C D
0 1 2 1 4
1 3 0 2 2
2 1 5 3 1
最后,我想通过对子索引求和来将数据“汇总”到元索引中,以生成一个新的数据框,如下所示:
X Y Z
0 1 3 4
1 3 2 2
2 1 8 1
使用来自this answer 的concat 让我很接近,但似乎挑选每个子集是一个非常手动的过程。我的真实数据集具有更复杂的映射,因此我想在构建元索引时直接引用它。我认为一旦我确定了元索引,一个简单的groupby 应该可以让我得到总和,但我仍然停留在第一步。
【问题讨论】: