R中线性模型摘要中的有序因子变量？答案

【问题标题】：Ordered factor variables in summary of linear model in R?R中线性模型摘要中的有序因子变量？
【发布时间】：2017-11-13 09:19:52
【问题描述】：

我在 R 中有一个线性模型，其中包含所有可能的双向交互。模型中包含的变量之一是 JobAfter18：

> levels(AcademicData$JobAfter18)
[1] "No"                      "Yes, one job"            "Yes, two jobs"           "Yes, more than two jobs"

在此处查看时，此变量具有这 4 个因子水平。然而，在拟合的总结中，它出现如下：

AcademicData$JobAfter18.L                                          34.042724  33.857406   1.005  0.31725    
AcademicData$JobAfter18.Q                                         -43.296277  20.763852  -2.085  0.03976 *  
AcademicData$JobAfter18.C                                         -14.816135   8.309894  -1.783  0.07782 .

L、Q 和 C 来自哪里，它们是什么意思？我意识到因子变量将在输出中包含 n-1 个因子水平，因为未包含的是与其他变量进行比较的基线。我只是没有关注为什么水平会出现这些字母而不是被写出来，因为它们是针对其他变量的，例如在这里看到的具有“男性”和“女性”水平的“性别”因子变量：

AcademicData$SexMale                                               19.421651  12.331565   1.575  0.11863

【问题讨论】：

这可能是由于您的因子值在其中获得了空间。尝试删除空间并检查。
似乎某处发生了冲突。也许您的代码中有一部分会转换变量JobAfter18。或者，也许你有两次这个变量？检查您是否有一个名为 JobAfter18. 的变量，因为那里的那个点对我来说看起来很可疑。例如。你有变量JobAfter18 取值.L, .Q, .C 吗？或者变量JobAfter18. 取值L, Q, C？
我认为这真的很奇怪，与具体数据无关。

标签： r

【解决方案1】：

L、Q 和 C 是因为 JobAfter18 设置为有序因子。请参阅 Interpretation of ordered and non-ordered factors, vs. numerical predictors in model summary 以获得很好的解释。

【讨论】：