【发布时间】:2021-11-21 17:35:13
【问题描述】:
我有一个这样的数据框:
offer_id hurdle hurdle_lvl reward_value
0 5c0c1545a944456aa28dcf578e0cbdd2 35000.0 1 500.0
1 5c0c1545a944456aa28dcf578e0cbdd2 40000.0 2 1500.0
2 5c0c1545a944456aa28dcf578e0cbdd2 45000.0 3 3000.0
3 f21306541ae046edbdf0a79daea3a005 500.0 1 25.0
4 f21306541ae046edbdf0a79daea3a005 750.0 2 100.0
5 f21306541ae046edbdf0a79daea3a005 25000.0 2 1500.0
我需要重新格式化它
offer_id hurdle_1 hurdle_2 hurdle_3 reward_1 reward_2 reward_3
0 5c0c1545a944456aa28dcf578e0cbdd2 35000.0 40000.0 45000.0 500.0 1500.0 3000.0
1 f21306541ae046edbdf0a79daea3a005 500.0 750.0 25000.0 25.0 100.0 1500.0
因此,根据 hurdle_lvl 列将障碍和奖励行堆叠为列。非常感谢任何帮助
所以我使用了数据透视表:
y.pivot_table(index=y.groupby('hurdle_lvl').cumcount(), columns='hurdle_lvl', values=['hurdle','reward_value'])
但这给了我一个如下的数据框:
hurdle reward_value
hurdle_lvl 1 2 3 1 2 3
0 35000.0 40000.0 45000.0 500.0 1500.0 3000.0
1 500.0 750.0 30000.0 25.0 100.0 1500.0
问题是我丢失了 offer_id 映射。有什么方法可以将它与透视表结合起来?
【问题讨论】:
标签: python pandas dataframe pivot-table