【发布时间】:2020-01-17 17:28:28
【问题描述】:
我有一个 A 列和一个 B 列。在 Result 列中,我想计算按 A 列分组的 B 列的平均值(这意味着我想计算我在 Result 列中写入的内容)。
cor = pd.DataFrame({'A' : [100, 100, 100, 200, 200, 300, 300, 300, 300],
'B' : [10, np.NaN, 20, np.NaN, 50, 10, 40, 60, 80],
'Result': [15, 15, 15, 50, 50, 47.5, 47.5, 47.5, 47.5]})
print(cor)
values = cor.groupby('A').mean()
在我的数据集中我有大约 20 万行数据,所以这个函数应该是相当强大的。
【问题讨论】:
-
cor['Result'] = cor.groupby('A')['B'].transform('mean')