【发布时间】:2012-09-13 03:42:08
【问题描述】:
我应该计算不同的置信区间,我发现,在 R 中,我可以使用 predict-command 来做到这一点。但是我在理解我真正要做的事情方面遇到了问题。我应该计算3个不同的置信区间: 1) 对于回归线上的一个点 2) 对于预测的(未来)y 值 3)对于整个回归线。 好的..到目前为止我做了什么:
fm <- lm(alcohol~beers)
所以,要获得整个回归线的置信区间,我会尝试:predict(fm,data.frame(beers = newbeers), level = 0.9, interval = "confidence")
但我真的不知道 data.frame 是做什么的。
好的,我确实知道置信区间在 90% 的时间里保持实际值(这里是因为 0.9)。那么这是否意味着它在 90% 中拥有最佳回归线?
除了一个点和一个预测值之外,我无法完全理解任何东西的含义。另外,我只知道这种计算方式,那么我如何以其他两种方式计算呢?另外,我得到的输出给出了间隔的几个上限和下限。这是什么意思?
【问题讨论】:
-
查看
confint,如mod <- lm(mpg ~ hp + am, data = mtcars); confint(mod)并在R 控制台中输入?confint以了解更多信息 -
并在您的课程材料中注意标准偏差和标准误差(估计值)之间的区别。其中第一个与#2问题有关,而第二个与#1问题有关。最后一个问题将由回归线上方和下方的两条二次曲线来回答。
-
如果不是很明显,我会指出,因为这看起来很像作业(“我应该计算......”),回复的人试图给你有用的建议在没有实际为您回答问题的情况下找到答案。 StackOverflow 没有“无作业”政策,但 R 帮助列表(我们中的许多人已经从中迁移)有——我认为这也倾向于溢出到 StackOverflow 上的 [r] 文化中。
标签: r linear-regression