【问题标题】:How to identify sites that don't meet criteria?如何识别不符合标准的网站?
【发布时间】:2020-08-12 02:27:37
【问题描述】:

如何从一个数据框中选择不符合另一个数据框中某些标准的网站?

在我的示例中,我有两个站点(1 和 2),它们具有与之关联的变量(a、b、c 和 d)。但是,站点 2 缺少变量 c 和 d。

  Site = c(1,1,1,1,2,2),
  variable = c('a','b','c','d','a','b'))

我有兴趣查找缺少一组已定义变量的网站。我选择的变量在这里:

sel <- data.frame(variable = c('a','b','c'))

我正在努力解决这个问题:

Site  variable
2     c

【问题讨论】:

    标签: r filter dplyr


    【解决方案1】:

    对于每个site,您可以completevariable 的缺失组合并使用anti_join 和原始df 来获取缺失的组合。

    library(dplyr)
    df %>%
      tidyr::complete(Site, variable = sel$variable) %>%
      anti_join(df)
    
    #  Site variable
    #  <dbl> <chr>   
    #1     2 c       
    

    【讨论】:

    • 太棒了-谢谢。我喜欢这个完整的功能。
    猜你喜欢
    • 1970-01-01
    • 2011-05-11
    • 2012-09-27
    • 2011-03-13
    • 1970-01-01
    • 1970-01-01
    • 2021-06-04
    • 2011-05-21
    • 2022-08-03
    相关资源
    最近更新 更多