【发布时间】:2018-07-20 02:45:21
【问题描述】:
我有一个数据集,用于预测存储的值是否会在某个区域打开。我很困惑创建虚拟变量,并想知道如何为变量 Id、sales0、sales1、sales2、sales3、sales4、country、cosub 和许多创建虚拟变量......如果可能的话,推荐我如何做到这一点...... .
【问题讨论】:
标签: r statistics analytics dummy-variable
我有一个数据集,用于预测存储的值是否会在某个区域打开。我很困惑创建虚拟变量,并想知道如何为变量 Id、sales0、sales1、sales2、sales3、sales4、country、cosub 和许多创建虚拟变量......如果可能的话,推荐我如何做到这一点...... .
【问题讨论】:
标签: r statistics analytics dummy-variable
您可以使用 {dummy} 包
> library(dummy)
> df <- data.frame(name = c("A", "B", "B", "C", "D", "E", "E", "E"))
> dummy(df)
name_A name_B name_C name_D name_E
1 1 0 0 0 0
2 0 1 0 0 0
3 0 1 0 0 0
4 0 0 1 0 0
5 0 0 0 1 0
6 0 0 0 0 1
7 0 0 0 0 1
8 0 0 0 0 1
> cbind(df, dummy(df))
name name_A name_B name_C name_D name_E
1 A 1 0 0 0 0
2 B 0 1 0 0 0
3 B 0 1 0 0 0
4 C 0 0 1 0 0
5 D 0 0 0 1 0
6 E 0 0 0 0 1
7 E 0 0 0 0 1
8 E 0 0 0 0 1
【讨论】: