【问题标题】:filtering large data table by two variables in R [duplicate]通过R中的两个变量过滤大型数据表[重复]
【发布时间】:2017-11-17 18:59:08
【问题描述】:

使用下面的 RWE,我离实现我想要的结果还差一步。我可以识别唯一的组合,但我想获得所有三列的 data.table(ABC

a <- c(1,1,1,1,1,2,3,4,5,5,5,6,6,7,7,8,8,9,9,9,9,9,10,10,10)
b <- c(1,2,1,1,5,5,6,1,1,1,3,2,2,1,1,2,3,1,2,3,4,4,1,2,2)
c <- c(1,1,3,1,1,2,3,4,5,5,5,6,6,7,7,8,8,9,9,9,9,9,10,10,20)
df1 <- data.frame(a, b, c)
head(df1)
#
library(dplyr) # example using dplyr package
df1 %>%
  distinct(a,b)
#
unique( df1[ , 1:2 ] ) # using base R

这些命令从 df1 返回 ab 的唯一组合,但我希望输出也包括 data.frame 中的 c 值。

【问题讨论】:

  • df1[!duplicated(df1[, 1:2]), ] ?

标签: r


【解决方案1】:

我们需要使用.keep_all 作为TRUE。默认为FALSE

library(dplyr)
df1 %>% 
   distinct(a, b, .keep_all = TRUE)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-01-21
    • 2020-09-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多