R中的置信区间答案

【问题标题】：Confidence Intervals in RR中的置信区间
【发布时间】：2012-09-13 03:42:08
【问题描述】：

我应该计算不同的置信区间，我发现，在 R 中，我可以使用 predict-command 来做到这一点。但是我在理解我真正要做的事情方面遇到了问题。我应该计算3个不同的置信区间： 1) 对于回归线上的一个点 2) 对于预测的（未来）y 值 3）对于整个回归线。好的..到目前为止我做了什么：

fm <- lm(alcohol~beers)

所以，要获得整个回归线的置信区间，我会尝试：predict(fm,data.frame(beers = newbeers), level = 0.9, interval = "confidence") 但我真的不知道 data.frame 是做什么的。好的，我确实知道置信区间在 90% 的时间里保持实际值（这里是因为 0.9）。那么这是否意味着它在 90% 中拥有最佳回归线？除了一个点和一个预测值之外，我无法完全理解任何东西的含义。另外，我只知道这种计算方式，那么我如何以其他两种方式计算呢？另外，我得到的输出给出了间隔的几个上限和下限。这是什么意思？

【问题讨论】：

查看confint，如mod <- lm(mpg ~ hp + am, data = mtcars); confint(mod) 并在R 控制台中输入?confint 以了解更多信息
并在您的课程材料中注意标准偏差和标准误差（估计值）之间的区别。其中第一个与＃2问题有关，而第二个与＃1问题有关。最后一个问题将由回归线上方和下方的两条二次曲线来回答。
如果不是很明显，我会指出，因为这看起来很像作业（“我应该计算......”），回复的人试图给你有用的建议在没有实际为您回答问题的情况下找到答案。 StackOverflow 没有“无作业”政策，但 R 帮助列表（我们中的许多人已经从中迁移）有——我认为这也倾向于溢出到 StackOverflow 上的 [r] 文化中。

标签： r linear-regression

【解决方案1】：

您在predict 函数中使用了data.frame(beers = newbeers)，这意味着它是一个预测区间。请注意，newbeers 是由新数据而不是您的原始数据（用于拟合线性模型）组成的数据框。

对于置信区间，只需使用 confint 函数，该函数（默认情况下）为您提供每个回归系数（在本例中为截距和斜率）的 95% CI。

关于回归线上的一点，请看最后两张幻灯片here。单个点的置信区间必须大于回归线的置信区间。

希望这会有所帮助！

【讨论】：