【发布时间】:2015-07-08 01:01:32
【问题描述】:
我正在使用如下所示的数据集(值已更改,实际数据要大得多)
fruit_type, temp, count
apple, 12, 4
apple, 14, 6
pear, 12, 6
pear, 16, 2
grape 12, 5
peach, 9, 33
peach 6, 3
我正在尝试利用一个 numpy agg 函数来查找每个计数在每个温度下的总计数百分比。我还想要一个代表总数的列。下面是我一直在尝试的代码。
data3 = data2.groupby('fruit_type')['count'].agg({
'prob' : lambda count: ((count) / count.sum()),
'total' : lambda count: count.size
})
温度值是离散的。我希望 count 逐行汇总,其中总计数总和按水果类型分组。请让我知道我的代码有什么问题。
【问题讨论】:
标签: python numpy pandas lambda