【问题标题】:Ordered factor variables in summary of linear model in R?R中线性模型摘要中的有序因子变量?
【发布时间】:2017-11-13 09:19:52
【问题描述】:

我在 R 中有一个线性模型,其中包含所有可能的双向交互。模型中包含的变量之一是 JobAfter18:

> levels(AcademicData$JobAfter18)
[1] "No"                      "Yes, one job"            "Yes, two jobs"           "Yes, more than two jobs"

在此处查看时,此变量具有这 4 个因子水平。然而,在拟合的总结中,它出现如下:

AcademicData$JobAfter18.L                                          34.042724  33.857406   1.005  0.31725    
AcademicData$JobAfter18.Q                                         -43.296277  20.763852  -2.085  0.03976 *  
AcademicData$JobAfter18.C                                         -14.816135   8.309894  -1.783  0.07782 .

L、Q 和 C 来自哪里,它们是什么意思?我意识到因子变量将在输出中包含 n-1 个因子水平,因为未包含的是与其他变量进行比较的基线。我只是没有关注为什么水平会出现这些字母而不是被写出来,因为它们是针对其他变量的,例如在这里看到的具有“男性”和“女性”水平的“性别”因子变量:

AcademicData$SexMale                                               19.421651  12.331565   1.575  0.11863 

【问题讨论】:

  • 这可能是由于您的因子值在其中获得了空间。尝试删除空间并检查。
  • 似乎某处发生了冲突。也许您的代码中有一部分会转换变量JobAfter18。或者,也许你有两次这个变量?检查您是否有一个名为 JobAfter18. 的变量,因为那里的那个点对我来说看起来很可疑。例如。你有变量JobAfter18 取值.L, .Q, .C 吗?或者变量JobAfter18. 取值L, Q, C
  • 我认为这真的很奇怪,与具体数据无关。

标签: r


【解决方案1】:

L、Q 和 C 是因为 JobAfter18 设置为有序因子。请参阅 Interpretation of ordered and non-ordered factors, vs. numerical predictors in model summary 以获得很好的解释。

【讨论】:

    猜你喜欢
    • 2021-04-21
    • 2018-07-07
    • 2015-07-21
    • 2017-08-11
    • 2021-07-29
    • 1970-01-01
    • 1970-01-01
    • 2012-06-11
    相关资源
    最近更新 更多