【发布时间】:2021-09-17 10:57:26
【问题描述】:
我需要使用 R 在逻辑回归中将 3 个虚拟变量的可能组合创建为一个分类变量。 我手动进行了组合,如下所示:
| new_variable_code | variable_1 | variable_2 | variable_3 |
|---|---|---|---|
| 1 | 0 | 0 | 0 |
| 2 | 0 | 1 | 0 |
| 3 | 0 | 1 | 1 |
| 4 | 1 | 0 | 0 |
| 5 | 1 | 1 | 0 |
| 6 | 1 | 1 | 1 |
我排除了其他两个选项(0 0 1)和(1 0 1),因为我不需要它们,它们没有由数据表示。 然后,我将 new_variable_code 与其他预测变量一起用作逻辑回归中的一个因素。
我的问题是:是否有任何自动化方式来创建相同的 new_variable_code?或者甚至是另一种计量经济学技术,将 3 个虚拟变量编码为逻辑回归模型中的 1 个分类变量?
我的目标:了解哪个变量组合在结果变量上的优势比最高(以及在同一模型中解释的其他预测变量)。
谢谢
【问题讨论】:
标签: r combinations logistic-regression categorical-data dummy-variable