通过R中的两个变量过滤大型数据表[重复]答案

【问题标题】：filtering large data table by two variables in R [duplicate]通过R中的两个变量过滤大型数据表[重复]
【发布时间】：2017-11-17 18:59:08
【问题描述】：

使用下面的 RWE，我离实现我想要的结果还差一步。我可以识别唯一的组合，但我想获得所有三列的 data.table（A、B 和 C）

a <- c(1,1,1,1,1,2,3,4,5,5,5,6,6,7,7,8,8,9,9,9,9,9,10,10,10)
b <- c(1,2,1,1,5,5,6,1,1,1,3,2,2,1,1,2,3,1,2,3,4,4,1,2,2)
c <- c(1,1,3,1,1,2,3,4,5,5,5,6,6,7,7,8,8,9,9,9,9,9,10,10,20)
df1 <- data.frame(a, b, c)
head(df1)
#
library(dplyr) # example using dplyr package
df1 %>%
  distinct(a,b)
#
unique( df1[ , 1:2 ] ) # using base R

这些命令从 df1 返回 a 和 b 的唯一组合，但我希望输出也包括 data.frame 中的 c 值。

【问题讨论】：

df1[!duplicated(df1[, 1:2]), ] ?

标签： r

【解决方案1】：

我们需要使用.keep_all 作为TRUE。默认为FALSE

library(dplyr)
df1 %>% 
   distinct(a, b, .keep_all = TRUE)

【讨论】：