置信区间答案

【问题标题】：Confidence interval置信区间
【发布时间】：2014-06-30 19:56:00
【问题描述】：

我有一个 160 的样本。平均值是 262，标准偏差是 165。正态分布曲线很好，从大约 -200（平均值 -3*偏差）到接近 800（平均值 + 3*偏差）。在下一步中，我正在查看 95% 的置信区间。对于这个例子，我在 excel 中使用了函数 CONFIDENCE，它说这个间隔是 [236,287]。

我的问题是 - 为什么这个范围这么小？每本书都将 95% 的置信区间陈述并显示为大约 +/- 2*st.dev.，在我的情况下，这与它相去甚远。对此有何解释？如此小的范围可能具有很大的欺骗性。

感谢您的 cmets 加斯珀

【问题讨论】：

我的下意识反应是，您对 CONFIDENCE() 函数的参数有些有趣。您能否粘贴您的代码以阐明您到目前为止所做的工作？

标签： excel math confidence-interval

【解决方案1】：

你把两件事混为一谈：

95% 的值在正态分布范围内均值 +/- 2 个标准差
给定样本均值，真实均值的置信区间是多少。 Excel 告诉您，真实均值在 236 到 287 范围内的可能性为 95%。随着样本数量的增加，该置信区间将变得更窄（有关更多详细信息，请查阅中心极限定理）

confidence 函数的 excel 文档还有一些explanation

【讨论】：

【解决方案2】：

置信区间是根据标准误差计算的，这不是我们熟悉的标准差（好吧，无论如何都不是直接的）。计算标准误差的公式取决于被测量的度量（例如，在这种情况下的平均值，也许是 Cohen 的 d 在另一种情况下），一个常见的公式是“标准偏差除以样本量的平方根”。这在上一个答案中被引用，但它被称为标准偏差。

我认为从技术上讲，标准差只是估计量方差的平方根的名称，因此无论是否称其为标准差是错误的或不是超出了我的专业知识，但是如果您尝试计算置信区间，您最常会发现它们是根据标准错误定义的。我最近自己遇到了这个问题，因为我使用上面给出的标准误差公式，但它不是 Cohen d 标准误差的正确公式......

【讨论】：

【解决方案3】：

采样数据以N(u,s²)为正态分布，n个样本的平均值分布为N(u,s²/n)。也就是说，样本的平均值具有标准偏差 s/sqrt(n)。

excel 函数假定给定单个观测值的分布参数并计算 n 个样本平均值的预期分布，因此它计算 s/sqrt(n)=165/sqrt(160) 大约 13 并且即 2-sigma-interval。

【讨论】：