【发布时间】:2018-02-24 09:26:13
【问题描述】:
我想对单个列进行分组,然后将 agg 与几列的均值一起使用,但只需为其余列选择 first 或 last。这在 pandas 中是可能的,但目前在 Dask 中不支持。这该怎么做?谢谢。
aggs = {'B': 'mean', 'C': 'mean', 'D': 'first', 'E': 'first'}
ddf.groupby(by='A').agg(aggs)
【问题讨论】:
-
我会 raise an issue 提出功能请求。
-
谢谢@MRocklin,问题在这里:github.com/dask/dask/issues/3206
-
这已在 2018 年 4 月实现 here。所以您的代码现在应该可以直接使用了。
标签: python pandas-groupby dask