【发布时间】:2026-01-18 18:10:01
【问题描述】:
我有以下数据框,将用作 logit 回归的输入:
my_frame<-data.frame(y=c(1,0,1),A=c(0,1,1),B=c(1,0,0),C=c(0,0,0),t=c(1,1,1),x=c(1,0,0),z=c(1,0,1))
知道虚拟变量 A、B 和 C 通过线性方程 (A+B+C=1) 连接,我需要在继续之前删除三个中的一个。
y A B C t x z
1 0 1 0 1 1 1
0 1 0 0 1 0 0
1 1 0 0 1 0 1
现在,这是困难的部分。我想随机排除由 A、B、C 和 D 组成的组中的一列,但不排除数据帧最后一行中值为 1 的列。 在我的示例中,我希望随机排除 B 和 C 之一。
列 D 不存在,因为在这个特定的数据框中,它的值始终为 0,但它仍然是同一组变量的一部分。
【问题讨论】: