【发布时间】:2016-09-08 10:41:51
【问题描述】:
如何计算 pandas 中的分组百分比?
类似于 Pandas: .groupby().size() and percentages 或 Pandas Very Simple Percent of total size from Group by 我想计算每组值的百分比。
我怎样才能做到这一点?
我的数据集的结构类似于
ClassLabel, Field
最初,我对ClassLbel 和Field 都进行了汇总
grouped = mydf.groupby(['Field', 'ClassLabel']).size().reset_index()
grouped = grouped.rename(columns={0: 'customersCountPerGroup'})
现在我想知道每个组中每个组的客户百分比。可以像mydf.groupby(['Field']).size() 一样获得组总数,但我既不能将其合并为一列,也不能确定这是正确的方法 - 一定有更简单的方法。
编辑
我想仅基于单个组计算百分比,例如3 0 0.125 1 0.250 0 + 1 --> 0.125 + 0.250 = 0,375 的总和,并使用此值来划分/归一化分组而不是分组.sum()
【问题讨论】:
标签: python pandas group-by percentage