【发布时间】:2017-06-02 04:05:45
【问题描述】:
在遍历variableA 列时,我想生成一个新列,只要variableA 或variableB 或variableB 中的一行等于当前行variableA 的值。示例数据:
values variableA variableB
0 134 1 3
1 12 2 6
2 43 1 2
3 54 3 1
4 16 2 7
只要variableA 与variableA 的当前行匹配,我就可以选择values 的总和,使用:
df.groupby('variableA')['values'].transform('sum')
但只要variableB 与variableA 的当前行匹配,我就选择values 的总和。我尝试了.loc,但它似乎与.groupby 配合得不好。预期输出如下:
values variableA variableB result
0 134 1 3 231
1 12 2 6 71
2 43 1 2 231
3 54 3 1 188
4 16 2 7 71
谢谢!
【问题讨论】:
标签: python pandas conditional-statements