【发布时间】:2018-07-18 07:48:30
【问题描述】:
我有一个数据集 (DF),如下所示:
ID DOB Age Outcome
1 1/01/80 18 1
1 1/01/80 18 0
2 1/02/81 17 1
2 1/02/81 17 0
3 1/03/70 28 1
我想将我的数据库更改为宽格式,以便每个 ID 有一行。但是,鉴于每个 ID 的 DOB 和 Age 都相同,我希望这些变量在新数据库中成为单列,并且只为 Outcome 变量提供多列,如下所示:
ID DOB Age Outcome.1 Outcome.2
1 1/01/80 18 1 0
2 1/02/81 17 1 0
3 1/03/70 28 1 NA
我尝试过使用 tidyr 和 reshape,但我似乎无法将数据库转换为这种格式。例如当我使用代码时:
spread(DF, key=ID, value = Outcome)
我收到一个错误,表明我有重复的行标识符。有没有办法让数据库变成我想要的格式?
谢谢。
【问题讨论】: