【发布时间】:2019-04-11 01:42:04
【问题描述】:
我想通过存储在每个 ID 组的另一列中的状态来计算值的差异。
数据集是:
# Create the dataframe
d = {'ID': ['1', '1', '1', '1', '2', '2', '2', '2'],
'Category': ['A','B','C','D','A','B','C','D'],
'Value': ['5','9','10','11','8','13','20','25']}
df = pd.DataFrame(data=d)
数据集如下所示:
ID Category Value
1 A 5
1 B 9
1 C 10
1 D 11
2 A 8
2 B 13
2 C 20
2 D 25
例如,我想计算每个 ID 的 B 类和 D 类值的差异。但我不确定我应该如何将计算与 groupby 结合起来。
理想的数据集应该是:
ID diff(B,D)
1 2
2 12
感谢任何人回答这个问题!
【问题讨论】: