统计问题答案

【问题标题】：Statistics Question统计问题
【发布时间】：2009-11-13 03:28:27
【问题描述】：

假设我对 10 个人进行了一项调查，询问是否将一部电影评为 0 到 4 星。允许的答案是 0、1、2、3 和 4。

平均值为 2.0 颗星。

如何计算这个 2.0 星级的确定性（或不确定性）？理想情况下，我想要一个介于 0 和 1 之间的数字，其中 0 代表完全不确定，1 代表完全确定。

10 个人选择 ( 2, 2, 2, 2, 2, 2, 2, 2, 2, 2 ) 的情况似乎是最确定的，而 10 个人选择 ( 0, 0, 0, 0, 0, 4, 4, 4, 4, 4 ) 是最不确定的。 ( 0, 1, 1, 2, 2, 2, 2, 3, 3, 4 ) 会在中间的某个地方。

【问题讨论】：

【解决方案1】：

标准差不具有请求的属性。当每个人都选择相同的答案时，它为零，当有五个 0 和五个 4 时，它可以达到 sqrt(40/9) = 2.11。

我建议你使用 1-stdev(x)/sqrt(40/9)，当每个人都同意时取值为 1，当有五个 0 和五个 4 时取值为 0。

【讨论】：

我也在想这样的事情，但我不知道是否有专门解决这类问题的统计计算。我期待在谷歌上搜索并找到一些与计算回答主观调查问题的“一致程度”相关的明显内容，但没有运气。感谢您的答复。我会试试你的建议，看看效果如何。

【解决方案2】：

你在这里追求的功能是standard deviation。

您的三个示例的标准差分别为 0（表示无偏差）、2.1（大偏差）和 1.15（介于两者之间）。

【讨论】：

【解决方案3】：

你想要的是standard deviation。

【讨论】：

【解决方案4】：

您应该考虑平均值是否适合此类信息。即 2 星评分的电影是 4 星评分的两倍吗？

使用百分位数（例如中位数）来表示集中趋势，并使用百分位数范围（例如 IQR）来衡量“确定性”，可能会更好地为您服务。与上面的答案一样，值为 0 时确定性最大，因为您实际上是在测量偏离集中趋势的情况。

顺便说一句，对 10 人的调查太小，无法进行有意义的统计分析。

【讨论】：