【发布时间】:2018-01-04 23:53:17
【问题描述】:
我经常发现自己在数据帧上执行 groupby-apply,然后将结果与原始数据帧合并。这是一个例子。假设df 有 A 列和 B 列。我想添加另一列,其值是 B 列与当前行具有相同 A 列值的所有行的总和。以下内容可以完成这项工作,但显然不是最佳的
df.join(df.groupby('A')['B'].sum(), on='A', rsuffix='_sum')
是否可以将原始索引保留在 groupby-sum 中?
【问题讨论】: