【发布时间】:2022-01-23 15:13:19
【问题描述】:
我想找到归一化频率的标准偏差。
我的频率分布范围为 1 到 9,归一化后加起来为 1。 这些值作为浮点数存储在不同的 pandas 列中
df[names].iloc[0]
pred_percet_rating_1 0.009985
pred_percet_rating_2 0.023371
pred_percet_rating_3 0.045363
pred_percet_rating_4 0.090492
pred_percet_rating_5 0.134723
pred_percet_rating_6 0.188476
pred_percet_rating_7 0.202444
pred_percet_rating_8 0.204562
pred_percet_rating_9 0.100585
第一行代表一个已被人们评价过的产品。它最常被评为 7(20% 的收视率)或 8(也是 20% 的收视率)。
现在我想为每一行计算一个标准偏差,但我所有的方法都失败了,因为我必须以某种方式转换列之间的距离。我已经尝试制作一个 np.histogramm 来使用收益来计算标准偏差,但无济于事。
任何指针都非常受欢迎!
【问题讨论】:
标签: python pandas numpy statistics standard-deviation