【问题标题】:Confidence interval置信区间
【发布时间】:2014-06-30 19:56:00
【问题描述】:

我有一个 160 的样本。平均值是 262,标准偏差是 165。正态分布曲线很好,从大约 -200(平均值 -3*偏差)到接近 800(平均值 + 3*偏差)。在下一步中,我正在查看 95% 的置信区间。对于这个例子,我在 excel 中使用了函数 CONFIDENCE,它说这个间隔是 [236,287]。

我的问题是 - 为什么这个范围这么小?每本书都将 95% 的置信区间陈述并显示为大约 +/- 2*st.dev.,在我的情况下,这与它相去甚远。对此有何解释?如此小的范围可能具有很大的欺骗性。

感谢您的 cmets 加斯珀

【问题讨论】:

  • 我的下意识反应是,您对 CONFIDENCE() 函数的参数有些有趣。您能否粘贴您的代码以阐明您到目前为止所做的工作?

标签: excel math confidence-interval


【解决方案1】:

你把两件事混为一谈:

  • 95% 的值在正态分布范围内均值 +/- 2 个标准差

  • 给定样本均值,真实均值的置信区间是多少。 Excel 告诉您,真实均值在 236 到 287 范围内的可能性为 95%。随着样本数量的增加,该置信区间将变得更窄(有关更多详细信息,请查阅中心极限定理)

confidence 函数的 excel 文档还有一些explanation

【讨论】:

    【解决方案2】:

    置信区间是根据标准误差计算的,这不是我们熟悉的标准差(好吧,无论如何都不是直接的)。计算标准误差的公式取决于被测量的度量(例如,在这种情况下的平均值,也许是 Cohen 的 d 在另一种情况下),一个常见的公式是“标准偏差除以样本量的平方根”。这在上一个答案中被引用,但它被称为标准偏差。

    我认为从技术上讲,标准差只是估计量方差的平方根的名称,因此无论是否称其为标准差是错误的或不是超出了我的专业知识,但是如果您尝试计算置信区间,您最常会发现它们是根据标准错误定义的。我最近自己遇到了这个问题,因为我使用上面给出的标准误差公式,但它不是 Cohen d 标准误差的正确公式......

    【讨论】:

      【解决方案3】:

      采样数据以N(u,s²)为正态分布,n个样本的平均值分布为N(u,s²/n)。也就是说,样本的平均值具有标准偏差 s/sqrt(n)。

      excel 函数假定给定单个观测值的分布参数并计算 n 个样本平均值的预期分布,因此它计算 s/sqrt(n)=165/sqrt(160) 大约 13 并且即 2-sigma-interval。

      【讨论】:

        猜你喜欢
        • 2017-10-23
        • 2023-03-27
        • 1970-01-01
        • 2018-02-18
        • 2015-09-14
        • 2012-08-31
        • 2021-01-09
        • 2011-04-18
        • 2020-02-04
        相关资源
        最近更新 更多