【发布时间】:2019-04-07 12:14:45
【问题描述】:
我希望标题不言自明;我想补充一点,可以假设每个键具有相同数量的值。 在线搜索标题得到以下解决方案:
Split pandas dataframe based on groupby
这应该可以解决我的问题,尽管它没有。 我举个例子:
输入:
pd.DataFrame(data={'a':['foo','foo','foo','bar','bar','bar'],'b':[1,2,3,4,5,6]})
输出:
pd.DataFrame(data={'a':['foo','bar'],'b':[1,4],'c':[2,5],'d':[3,6]})
直观地说,它是一个没有聚合函数的groupby 函数,或者是一个从键中生成列表的聚合函数。
显然,它可以使用 for 循环等“手动”完成,但在大型数据集上使用 for 循环在计算上非常昂贵。
【问题讨论】: