【发布时间】:2018-02-17 13:07:59
【问题描述】:
我有一个数据集,我需要根据另一列中的值有条件地删除重复的行。
具体来说,我需要删除size = 0 的任何行,只有当SampleID 是重复。
SampleID<-c("a", "a", "b", "b", "b", "c", "d", "d", "e")
size<-c(0, 1, 1, 2, 3, 0, 0, 1, 0)
data<-data.frame(SampleID, size)
我想删除行:
Sample ID size
a 0
d 0
并保持:
SampleID size
a 1
b 1
b 2
b 3
c 0
d 1
e 0
注意。实际数据集非常大,所以我不是在寻找一种方法来逐行删除已知行。
【问题讨论】:
-
请阅读:stackoverflow.com/help/how-to-ask 并创建可重现的示例。
-
澄清最后一条评论:您提供的代码无法运行。发布前在新的 R 会话中测试示例。
标签: r dataframe duplicates subset