【发布时间】:2018-04-06 00:37:19
【问题描述】:
我基于 Mincer-Wage-Equation 对多重回归建模,并添加了一个权重因子以使其代表整个人群。 但是当我将权重函数添加到我的模型中时,R 计算的标准化残差比我观察到的要少。
这是我的模型:
lm(log(earings) ~ Gender + Age + Age^2 + Education, weights= phrf)
所以我在分析残差时遇到了问题,因为当我试图根据 fit.values 绘制 rstandard 时,R 告诉我们:发现 rstandard() 中的不同变量长度。
这个问题只存在于 rstandard 和 rstudent 中,当我针对fitted.values 绘制正常的 resid() 时没有问题。
当我省略权重函数时,我也没有问题。
【问题讨论】:
-
这可能是由于
log(earings = 0) = -Inf的情况,这可能导致某些事件被丢弃?否则,请发布一个可重现的最小样本数据集。
标签: r linear-regression