【问题标题】:Is it appropriate to calculate r-squared of robust regression using rlm使用 rlm 计算稳健回归的 r 平方是否合适
【发布时间】:2020-05-21 05:36:56
【问题描述】:
我正在使用 MASS 的 rlm 函数来执行稳健的回归。与 lm 不同,summary 函数不返回 r-squared 的值。
因此适合使用1 - sum(residual^2)/(sum((Y-mean(Y))^2)? 进行计算
(对于方程的道歉,我不知道如何以更好的格式编写它)
【问题讨论】:
-
这个问题已经在 stats stackexchange 网站here有答案了
-
标签:
r
statistics
regression
robust
【解决方案1】:
当数据有很多异常值时,使用稳健线性回归(rlm)代替线性回归(lm);它也可以用于检测有影响的观察。
稳健回归使用迭代重加权最小二乘法 (IRLS) 进行最大似然估计 (MLE),而线性回归使用普通最小二乘法 (OLS),这就是 lm() 而不是 rlm 返回 R-squared(确定系数)的原因()。
现在谈到适当性,它不是评估稳健回归拟合的合适度量,因为它涉及计算公式中的平方损失=sum(residual^2)=sum(predicted values-observed values)^2 r平方。由于稳健回归涉及处理包含许多异常值的数据,因此该度量将导致荒谬的值,因为异常值的残差会产生较大的值,而且这些值很大并且是平方的!
这就是为什么在涉及异常值时使用 absolute loss=(predict-actual) 来评估拟合的原因。
希望这会有所帮助。