【问题标题】:Labelling the residuals on diagnostic plots在诊断图上标记残差
【发布时间】:2014-09-15 11:19:07
【问题描述】:
我在 R 中建立了一个线性回归模型,其中包含 3 个连续自变量和一个连续因变量。我已经生成了诊断图。
我现在想根据模型中未包含的二元分类自变量对我的诊断图上的每个残差的数据点进行标记/着色;
即当这个变量 = A 时,我想在我的诊断图上有一个蓝点,
当这个变量 = B 时,我想要一个红点,所以我的诊断图上会有红点和蓝点。
我想要一些关于如何做到这一点的建议。
【问题讨论】:
标签:
r
colors
data-visualization
diagnostics
【解决方案1】:
[您没有指定您尝试对哪些诊断图进行此操作。你也没有给出一个最小的可重复的例子,这使得你很难改变你正在做的事情来做你想做的事情。]
我将举一个例子来说明执行你需要的命令类型,你可以将它调整为你需要的任何显示。
library(MASS)
catsmdl <- lm(Hwt~Bwt,cats)
plot(residuals(catsmdl)~fitted(catsmdl), col=cats$Sex)
abline(h=0, col=8, lty=3)
给出:
这甚至适用于plot.lm,因为它有一个... 参数来将信息传递给较低级别的绘图函数。比如:
opar <- par()
par(mfrow=c(2,2))
plot(catsmdl,col=c("blue","darkorange")[as.numeric(cats$Sex)])
par(opar)
如果你用你喜欢的任何颜色替换c("blue","darkorange"),它应该可以工作。 (在 R 中有多种指定颜色的方法。)