【发布时间】:2018-02-15 14:53:09
【问题描述】:
我有一个元组列表 [(val1, freq1), (val2, freq2) .... (valn, freqn)]。我需要获取上述数据的中心趋势(均值、中位数)和偏差测量值(方差、均值)。我还想为这些值绘制箱线图。
我看到 numpy 数组具有从值列表中获取平均值/中值和标准差(或方差)的直接方法。
numpy(或任何其他知名库)是否有直接的方法来操作这样的频率分布表?
另外,以编程方式将上述元组列表扩展为一个列表的最佳方法是什么? (例如,如果 freq dist 是 [(1,3) , (50,2)],则获取列表 [1,1,1,50,50] 以使用 np.mean([1,1,1, 50,50]))
我看到了一个自定义函数here,但如果可能的话我想使用一个标准的实现
【问题讨论】:
-
@ayhan 我已将您的解决方案归因于描述......并澄清了我在寻找什么。可以去掉重复的标签吗?
标签: python python-3.x numpy dataframe