【发布时间】:2019-07-26 08:16:03
【问题描述】:
我想做groupby、shift 和cumsum,这似乎是一项微不足道的任务,但我仍然对我得到的结果感到头疼。有人可以告诉我我做错了什么。我在网上找到的所有结果都显示出与我正在做的事情相同或相同的变化。下面是我的实现。
temp = pd.DataFrame(data=[['a',1],['a',1],['a',1],['b',1],['b',1],['b',1],['c',1],['c',1]], columns=['ID','X'])
temp['transformed'] = temp.groupby('ID')['X'].cumsum().shift()
print(temp)
ID X transformed
0 a 1 NaN
1 a 1 1.0
2 a 1 2.0
3 b 1 3.0
4 b 1 1.0
5 b 1 2.0
6 c 1 3.0
7 c 1 1.0
这是错误的,因为实际的或我正在寻找的内容如下:
ID X transformed
0 a 1 NaN
1 a 1 1.0
2 a 1 2.0
3 b 1 NaN
4 b 1 1.0
5 b 1 2.0
6 c 1 NaN
7 c 1 1.0
非常感谢。
【问题讨论】:
-
temp2 = temp.groupby('ID').shift() temp2['ID'] = temp['ID'] temp2.groupby('ID').cumsum() 虽然是只是一个快速而肮脏的黑客。我更喜欢 Wen-Bens 的回答。
标签: python-3.x pandas pandas-groupby