【发布时间】:2019-09-18 18:41:21
【问题描述】:
我想根据多行中的其他列值在 python 数据框中创建一个新列。 例如,我的 python 数据框 df:
A | B
------------
10 | 1
20 | 1
30 | 1
10 | 1
10 | 2
15 | 3
10 | 3
我想创建基于变量 A 的值的变量 C,其条件来自多行中的变量 B。当第 i,i+1,... 行中变量 B 的值时,C 的值是这些行中变量 A 的总和。在这种情况下,我的输出数据框将是:
A | B | C
--------------------
10 | 1 | 70
20 | 1 | 70
30 | 1 | 70
10 | 1 | 70
10 | 2 | 10
15 | 3 | 25
10 | 3 | 25
我不知道实现这一目标的最佳方法。有人可以帮忙吗?
提前致谢
【问题讨论】:
-
df.groupby('B')['A'].transform('sum')
标签: python-3.x pandas jupyter-notebook