【发布时间】:2015-03-05 19:25:14
【问题描述】:
我有数据框(如下),其中包含在单次入院和不同入院期间收到不同诊断 (DX) 的病例 (ID)。我想扩大这个数据框,以便每次单独入院时,所有诊断都在单独的列中。我试过dplyrspread 函数,但它没有给出正确的结果。有什么建议吗?
ID DX Age Admitted
1 a 17 3/2/14
1 b 17 3/2/14
1 c 17 4/30/14
2 e 20 7/22/13
2 a 20 7/22/13
2 c 20 7/22/13
2 d 20 2/4/14
3 b 16 4/18/14
4 e 16 10/8/13
4 m 16 10/8/13
预期的输出如下所示:
ID DX1 DX2 DX3 Age Admitted
1 a b NA 17 3/2/14
1 c NA NA 17 4/30/14
2 e a c 20 7/22/13
2 d NA NA 20 2/4/14
3 b NA NA 16 4/18/14
4 e m NA 16 10/8/13
【问题讨论】:
-
您能否也显示预期的输出。可能是
library(reshape2); dcast(df1, ID~DX, value.var='Admitted') -
还描述您需要处理的录取日期。
-
宽格式,我不想要任何重复的录取日期
-
糟糕!现在是正确的。