【发布时间】:2019-10-06 18:30:37
【问题描述】:
我正在尝试添加一个新列,其中包含另一列的值的总和,但仅适用于不同的行。 假设我们有这个数据框:
col1 col2 vote
0 a 2 5
1 a 2 5
2 b 2 2
3 c 4 1
4 d 3 5
5 d 3 5
6 d 3 5
我想按 col2 分组,然后将不同对 col1 和 col 2 的所有投票相加(每对 col1 和 col2 的投票始终相同。
我正在尝试获得这个结果:
col1 col2 vote aggrVote
0 a 2 5 7
1 a 2 5 7
2 b 2 2 7
3 c 4 1 1
4 d 3 5 5
5 d 3 5 5
6 d 3 5 5
col2 的值 3 只有一个不同的 col1 的值,所以投票只有 5。col2 的值 2 有 3 个不同的 col1 的值 (a,b),所以总和是 5 + 2
【问题讨论】:
-
输入数据框的 col2 数据错误,其中 col1 为 c,应为 4 而不是 2
标签: python pandas pandas-groupby