【发布时间】:2014-03-23 15:53:53
【问题描述】:
我正在尝试弄清楚如何从数据框中删除所有唯一行,但如果它有重复,我希望保留它。例如 - 我希望其中的所有列与 col1 相同:
df<-data.frame(col1=c(rep("a",3),"b","c",rep("d",3)),col2=c("A","B","C",rep("A",3),"B","C"),col3=c(3,3,1,4,4,3,2,1))
df
col1 col2 col3
1 a A 3
2 a B 3
3 a C 1
4 b A 4
5 c A 4
6 d A 3
7 d B 2
8 d C 1
subset(df,duplicated(col1))
col1 col2 col3
2 a B 3
3 a C 1
7 d B 2
8 d C 1
但我想要第 1、2、3、6、7、8 行,因为它们都有相同的第 1 列。如何让第 1 行和第 6 行包含在内?或者,相反,如何删除没有重复的行?
【问题讨论】:
标签: r duplicates dataframe