【发布时间】:2017-04-14 03:53:44
【问题描述】:
我有一个如下形式的数据框:
ID value modified
1 AA 30 2016-11-03
2 AB 40 2016-11-04
3 AC 50 2016-11-05
4 AA 60 2016-11-06
5 AB 20 2016-11-07
我想识别 ID 列的所有重复行并删除修改时间相对较旧的行。所以输出将是:
ID value modified
1 AC 50 2016-11-05
2 AA 60 2016-11-06
3 AB 20 2016-11-07
我正在尝试的代码如下:
ID<-c('AA','AB','AD','AA','AB')
value<-c(30,40,50,60,20)
modified<-c('2016-11-03','2016-11-04','2016-11-05','2016-11-06','2016-11-07')
df<-data.frame(ID=ID,value=value,modified=modified)
df
ID value modified
1 AA 30 2016-11-03
2 AB 40 2016-11-04
3 AD 50 2016-11-05
4 AA 60 2016-11-06
5 AB 20 2016-11-07
df[!duplicated(df$ID),]
ID value modified
1 AA 30 2016-11-03
2 AB 40 2016-11-04
3 AD 50 2016-11-05
但这不是我想要的输出,我怎样才能删除旧条目?提前感谢您提供任何线索或提示。
【问题讨论】:
标签: r dataframe duplicates