【问题标题】:Statistics Question统计问题
【发布时间】:2009-11-13 03:28:27
【问题描述】:

假设我对 10 个人进行了一项调查,询问是否将一部电影评为 0 到 4 星。允许的答案是 0、1、2、3 和 4。

平均值为 2.0 颗星。

如何计算这个 2.0 星级的确定性(或不确定性)?理想情况下,我想要一个介于 0 和 1 之间的数字,其中 0 代表完全不确定,1 代表完全确定。

10 个人选择 ( 2, 2, 2, 2, 2, 2, 2, 2, 2, 2 ) 的情况似乎是最确定的,而 10 个人选择 ( 0, 0, 0, 0, 0, 4, 4, 4, 4, 4 ) 是最不确定的。 ( 0, 1, 1, 2, 2, 2, 2, 3, 3, 4 ) 会在中间的某个地方。

【问题讨论】:

    标签: statistics


    【解决方案1】:

    标准差不具有请求的属性。当每个人都选择相同的答案时,它为零,当有五个 0 和五个 4 时,它可以达到 sqrt(40/9) = 2.11。

    我建议你使用 1-stdev(x)/sqrt(40/9),当每个人都同意时取值为 1,当有五个 0 和五个 4 时取值为 0。

    【讨论】:

    • 我也在想这样的事情,但我不知道是否有专门解决这类问题的统计计算。我期待在谷歌上搜索并找到一些与计算回答主观调查问题的“一致程度”相关的明显内容,但没有运气。感谢您的答复。我会试试你的建议,看看效果如何。
    【解决方案2】:

    你在这里追求的功能是standard deviation

    您的三个示例的标准差分别为 0(表示无偏差)、2.1(大偏差)和 1.15(介于两者之间)。

    【讨论】:

      【解决方案3】:

      你想要的是standard deviation

      【讨论】:

        【解决方案4】:

        您应该考虑平均值是否适合此类信息。即 2 星评分的电影是 4 星评分的两倍吗?

        使用百分位数(例如中位数)来表示集中趋势,并使用百分位数范围(例如 IQR)来衡量“确定性”,可能会更好地为您服务。与上面的答案一样,值为 0 时确定性最大,因为您实际上是在测量偏离集中趋势的情况。

        顺便说一句,对 10 人的调查太小,无法进行有意义的统计分析。

        【讨论】:

          猜你喜欢
          • 1970-01-01
          • 2010-12-21
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2020-05-02
          相关资源
          最近更新 更多