R传播所有列[重复]答案

【问题标题】：R Spreading all columns [duplicate]R传播所有列[重复]
【发布时间】：2016-06-15 09:59:18
【问题描述】：

我目前正在尝试做的是将所有列分散到多个列上，例如这个数据框

Person_ID  Car_ID Car_Type Car_Speed
a          1      x        50
a          2      y        70
a          3      z        100
b          4      y        70

我想把它变成这个

Person_ID  Car_ID1 Car_Type1 Car_Speed1 Car_ID2 Car_Type2 Car_Speed2 Car_ID3 Car_Type3 Car_Speed3
a          1        x        50         2      y        70           3       z         100    
b          4        y        70

有人可以帮忙吗？谢谢。

【问题讨论】：

标签： r dplyr tidyr spread

【解决方案1】：

这可以通过data.table 中的dcast 轻松完成，它可以占用多个value.var 列

library(data.table)#v1.9.7+
dcast(setDT(df1), Person_ID~rowid(Person_ID), 
              value.var = c("Car_ID", "Car_Type", "Car_Speed"))
#     Person_ID Car_ID_1 Car_ID_2 Car_ID_3 Car_Type_1 Car_Type_2 Car_Type_3 Car_Speed_1 Car_Speed_2
#1:         a        1        2        3          x          y          z          50          70
#2:         b        4       NA       NA          y         NA         NA          70          NA
#    Car_Speed_3
#1:         100
#2:          NA

或在创建按“Person_ID”分组的序列列后使用来自base R 的reshape

df2 <- transform(df1, Seq = ave(seq_along(Person_ID), Person_ID, FUN = seq_along))
reshape(df2, idvar = "Person_ID", timevar = "Seq", direction = "wide")

【讨论】：

得到一个'找不到函数“rowid”'或者我对rowid的理解有误？
@newRuser 这是1.9.7 版本，你可以从github下载。否则，通过setDT(df1)[, Seq := 1:.N, Person_ID] 在base R 解决方案中创建一个Seq 列，然后执行dcast 即dcast(df1, Person_ID~Seq, value.var = c("Car_ID", "Car_Type", "Car_Speed"))