【问题标题】:include error terms in linear regression model在线性回归模型中包含误差项
【发布时间】:2010-12-20 13:33:12
【问题描述】:

我想知道是否有办法为线性回归模型包含误差项,例如:

r = lm(y ~ x1+x2)

【问题讨论】:

  • 错误术语是什么意思?您的代码将适合以下线性模型:y = a + b1*x1 + b2*x2 + e 其中 e 是误差。
  • 所以模型已经包含了错误项?但我也看到了:y ~ A*B + Error(C)

标签: r linear-regression


【解决方案1】:

代码r = lm(y ~ x1+x2) 表示我们将 y 建模为 x1 和 x2 的线性函数。由于模型不会完美,因此会有一个残差项(即模型无法拟合的剩余项)。

在数学中,正如 Rob Hyndman 在 cmets 中指出的那样,y = a + b1*x1 + b2*x2 + e,其中 ab1b2 是常数,e 是您的残差(假定为正态分布)。

看一个具体的例子,考虑 R 附带的虹膜数据。

model1 <- lm(Sepal.Length ~ Sepal.Width + Petal.Length + Petal.Width, data=iris)

现在我们可以从模型中提取常量(相当于ab1b2,在这种情况下也是b3)。

> coefficients(model1)
(Intercept)  Sepal.Width Petal.Length  Petal.Width 
1.8559975    0.6508372    0.7091320   -0.5564827

已为模型中使用的每一行数据计算残差。

> residuals(model1)
           1             2             3             4             5       
0.0845842387  0.2100028184 -0.0492514176 -0.2259940935 -0.0804994772
# etc. There are 150 residuals and 150 rows in the iris dataset.

(编辑:将摘要信息剪切为不相关。)


编辑:

您在 cmets 中提到的 Error 值在 aov 的帮助页面上进行了解释。

If the formula contains a single ‘Error’ term, this is used to
specify error strata, and appropriate models are fitted within
each error stratum.

比较以下内容(改编自 ?aov 页面。)

> utils::data(npk, package="MASS")
> aov(yield ~  N*P*K, npk)
Call:
   aov(formula = yield ~ N * P * K, data = npk)

Terms:
                       N        P        K      N:P      N:K      P:K    N:P:K Residuals
Sum of Squares  189.2817   8.4017  95.2017  21.2817  33.1350   0.4817  37.0017  491.5800
Deg. of Freedom        1        1        1        1        1        1        1        16

Residual standard error: 5.542901 
Estimated effects may be unbalanced

> aov(yield ~  N*P*K + Error(block), npk)
Call:
aov(formula = yield ~ N * P * K + Error(block), data = npk)

Grand Mean: 54.875 

Stratum 1: block

Terms:
                    N:P:K Residuals
Sum of Squares   37.00167 306.29333
Deg. of Freedom         1         4

Residual standard error: 8.750619 
Estimated effects are balanced

Stratum 2: Within

Terms:
                        N         P         K       N:P       N:K       P:K Residuals
Sum of Squares  189.28167   8.40167  95.20167  21.28167  33.13500   0.48167 185.28667
Deg. of Freedom         1         1         1         1         1         1        12

Residual standard error: 3.929447 
1 out of 7 effects not estimable
Estimated effects may be unbalanced

【讨论】:

  • 嘿 Richie,这看起来很有趣。所以我想我可以在 R 中试试这个: > v = aov(yield ~ NPK, npk) >v2 = aov(yield ~ NPK + Error( block), npk) > coefficients(v) > coefficients(v2) 这是什么类型的回归? N1:P1 和 N1:P1:K1 等系数是多少?
  • @phpdash:这有时被称为裂区方差分析。 Michael Crawley 在 Statistical Computing 中有一个分步示例。 books.google.com/books?id=OlPUa6lVeb0C&pg=PA345#
猜你喜欢
  • 2018-10-13
  • 1970-01-01
  • 1970-01-01
  • 2021-10-05
  • 2020-08-09
  • 2019-10-09
  • 2017-10-02
  • 1970-01-01
  • 2014-09-17
相关资源
最近更新 更多