【发布时间】:2015-08-17 19:12:40
【问题描述】:
不久前,我问了一个关于从mutually exclusive dummy variables 创建分类变量的问题。现在,事实证明我想做相反的事情。
如何从单个分类变量 (time) 在长格式数据集中创建虚拟变量?例如下面的数据框...
id time
1 1
1 2
1 3
1 4
会变成……
id time time_dummy_1 time_dummy_2 time_dummy_3 time_dummy_4
1 1 1 0 0 0
1 2 0 1 0 0
1 3 0 0 1 0
1 4 0 0 0 1
我确定这是微不足道的(如果这个问题是重复的,请告诉我——我不确定它是否是重复的,但如果是这样,我很乐意删除)。谢谢!
【问题讨论】:
-
你能举一个输入/输出的例子吗?这还不完全清楚。
-
如果你使用
library(tidyr)和library(plyr),那就是:df %>% mutate(time2=paste0("time_dummy_",time)) %>% spread(time2, id, fill=0)
标签: r