【发布时间】:2021-02-19 05:05:33
【问题描述】:
在数据框中,我有一列有时具有相同 id 的重复值,即 A 列。当 A 列中相同 id 的值相似时,我只想保留第一个。想象一个大数据集。我该如何做到这一点?谢谢!
A <- c(18,6,39,39,3,56)
set.seed(1)
B <- sample(100,6)
set.seed(2)
C <- sample(100,6)
df <- data.frame(id = rep(1:3, each=2),A,B,C)
df
id A B C
1 1 18 68 85
2 1 6 39 79
3 2 39 1 70
4 2 39 34 6
5 3 3 87 32
6 3 56 43 8
id <- unique(df$id)
if (i in 1:length(id)){
df[df$id==i,]
if(length(df[df$A])>1){
keep the first
}
else{
return(df)
}
}
Expected output:
id A B C
1 1 18 68 85
2 1 6 39 79
3 2 39 1 70
5 3 3 87 32
6 3 56 43 8
【问题讨论】:
标签: r