【发布时间】:2020-11-01 20:54:11
【问题描述】:
我有一个数据框,我想将其转换为摘要数据框。我希望按数据框中某些列的所有可能组合进行分组。
这是初始数据框
我还为每种不同类型的列提供了三个列表:
always_include_columns = ['digimon']
combination_columns = ['stage','type']
sum_column = 'points'
这是数据框:
df = pd.DataFrame({
'digimon':['Kuramon','Pabumon','Punimon','Kuramon','Pabumon','Punimon','Kuramon','Pabumon','Punimon','Kuramon','Pabumon','Punimon'],
'stage':['Baby','Baby','Baby','In-Training','In-Training','In-Training','Baby','Baby','Baby','In-Training','In-Training','In-Training'],
'type':['Neutral','Neutral','Neutral','Neutral','Neutral','Neutral','Fire','Fire','Fire','Fire','Fire','Fire'],
'points':[590,950,870,940,1030,930,1086,1143,1201,1258,1316,1373]})
在此示例中,我想按阶段和类型的每种组合进行分组(例如,仅阶段,仅类型,阶段和类型,两者都不是)。如果缺少一列,我希望它在决赛桌中说“全部”。所以这相当于堆叠 4 个 group-by 表。或者更一般的combination_columns^2 分组表。
【问题讨论】:
标签: pandas dataframe pandas-groupby combinations