【发布时间】:2018-01-18 18:48:30
【问题描述】:
我的数据结构类似于以下内容:
a<-data.frame(ID=c(1,2,2,2,3,3),Date=as.Date(c("2017-01-01","2017-01-02","2017-01-03","2017-01-04","2017-01-05","2017-01-06")))
print(a)
ID Date
1 2017-01-01
2 2017-01-02
2 2017-01-03
2 2017-01-04
3 2017-01-05
3 2017-01-06
我想删除任何重复的ID 并根据Date 保留最近的一个以获得以下信息:
b<-data.frame(ID=c(1,2,3),Date=as.Date(c("2017-01-01","2017-01-04","2017-01-06")))
print(b)
ID Date
1 2017-01-01
2 2017-01-04
3 2017-01-06
谢谢!
【问题讨论】:
-
尝试在重复链接中讨论的
top_n选项:a %>% group_by(ID) %>% top_n(1, Date)