【发布时间】:2015-08-01 16:29:45
【问题描述】:
我正在尝试重塑数据框,使列中的每个唯一值都成为二进制列。
我收到的数据如下所示:
df <- data.frame(id = c(1,1,2),
value = c(200,200,1000),
feature = c("A","B","C"))
print(df)
##id,value,feature
##1,200,A
##1,200,B
##2,1000,C
我正在尝试将其重塑为:
##trying to get here
##id,value,A,B,C
##1,200,1,1,0
##2,1000,0,0,1
spread(df,id,feature) 失败,因为 id 重复。
我想重塑数据以促进建模 - 我试图根据特征的存在与否来预测价值。
【问题讨论】:
-
reshape2包的dcast(df, id + value ~ ..., length)运行良好。但这个问题很可能是重复的。