【发布时间】:2016-12-30 20:00:39
【问题描述】:
我不确定这个问题是否更适合这里或交叉验证。我希望我做出了正确的选择。
考虑这个例子:
library(dplyr)
setosa <- iris %>% filter(Species == "setosa") %>% select(Sepal.Length, Sepal.Width, Species)
library(ggplot2)
ggplot(data = setosa, aes(x = Sepal.Length, y = Sepal.Width)) +
geom_point() +
geom_smooth(method ="lm", formula = y ~ poly(x,2))
默认情况下,ggplot“显示平滑附近的置信区间”(参见here),由回归曲线周围的灰色区域给出。我一直认为这些是simultaneous confidence bands for the regression curve,而不是逐点置信带。 ggplot2 文档参考predict 函数,了解有关如何计算标准误差的详细信息。但是,阅读predict.lm 的文档时,并没有明确说明同时计算置信带。那么,这里的正确解释是什么?
【问题讨论】:
-
我认为这在stats site 上更好,因为它似乎与 ggplot 关系不大,更多的是询问如何为线性回归计算置信区间:投票支持迁移跨度>
-
@WeihuangWong,感谢您的帮助,但您发布的链接讨论了置信区间和预测区间之间的差异。我不关心预测间隔。我只想知道
predict.lm()在用于计算置信度 带时,是计算同时 置信带还是逐点 置信带。 -
@user20650,你可能是对的。我特别问的是什么类型的置信区间
ggplot正在计算(逐点或同时)。这也是我最后选择在这里发帖的原因。无论如何,CV 可能更适合这个问题。我将对标题进行一些编辑以避免任何混淆,请稍等片刻。如果我没有收到任何答案,我会迁移(当然,假设版主到那时还没有迁移问题)。 -
嗨 Delta:因为 ggplot 只使用代码
predict(.., interval = "confidence")(您可以手动建模并绘制检查),所以问题似乎减少到这个间隔代表什么。
标签: r ggplot2 regression confidence-interval