【发布时间】:2017-10-05 10:21:33
【问题描述】:
我有一些列表格式的数据:150 多个组织的数据,每个 12 个月系列的数据。它的原始形式如下所示:
Name Size Date Figure
Org1 Medium Jun16 8.36
Org1 Medium Jul16 7.55
Org1 Medium Aug16 8.57
...
Org1 Medium May17 9.41
Org2 Large Jun16 12.12
Org2 Large Jul16 11.44
...
因此,每个组织都有一个唯一的名称、十二个月的数据以及三种规模(小型、中型、大型)中的一种。我已经成功地调整了这些数字,为我提供了每个组织的时间序列,即,
Name Jun16 Jul16 Aug16 Sep16 Oct16...
Org1 8.36 7.55 8.57 7.66 9.43
Org2 12.12 11.44 11.01 12.01 10.44...
但我想包含另一列,其中包含每个组织的规模。我用于枢轴的代码是:
dataPivot = dataRaw.pivot_table(index='Name', columns ='Date'],
aggfunc='sum', values = 'Figure').fillna(0)
其中dataRaw 是从 .csv 读取的原始数据。我尝试将'Size' 添加到columns 字段,但这只是为每种尺寸提供了12 个额外的列!
【问题讨论】:
标签: python pandas dataframe pivot-table