【发布时间】:2020-07-08 09:04:58
【问题描述】:
我有一个数据框,我想删除除一列之外的所有列中重复的行,并选择保留那些不是特定值的行。
在上面的示例中,除 col3 之外的所有列的第 3 行和第 4 行都是重复的,所以我只想保留一行。复杂的步骤是我想保留第 4 行而不是第 3 行,因为 col3 中的第 3 行被“排除”。一般来说,我只想保留没有“排除”的行(重复的)。
我的真实数据框有很多重复的行,在这 2 行重复的行中,其中之一肯定是“排除”的。
以下是可重现的前:
a <- c(1,2,3,3,7)
b <- c(4,5,6,6,8)
c <- c("red","green","excluded","orange","excluded")
d <- data.frame(a,b,c)
非常感谢!
更新:或者,删除重复项时,仅保留第二个观察值(第 4 行)。
【问题讨论】: