【发布时间】:2012-06-12 15:50:47
【问题描述】:
有没有一种方法可以编写DataFrame.agg 方法中使用的聚合函数,它可以访问多个正在聚合的数据列?典型的用例是加权平均、加权标准差函数。
我希望能够写出类似的东西
def wAvg(c, w):
return ((c * w).sum() / w.sum())
df = DataFrame(....) # df has columns c and w, i want weighted average
# of c using w as weight.
df.aggregate ({"c": wAvg}) # and somehow tell it to use w column as weights ...
【问题讨论】:
-
很好的文章解决了这个特定的 SO 问题:pbpython.com/weighted-average.html