【问题标题】:Count the number of missing values in groups in R计算R中组中缺失值的数量
【发布时间】:2020-04-26 19:43:20
【问题描述】:

我有一个小标题,有很多观察和变量。

我要做的只是计算(按变量 1 和变量 2 分组)变量 XXX 的平均值,以及每组缺失值的总数。

这是我目前所写的:

 data%>%
      group_by(variable1,variable2)%>%
      summarise(mean(variableXXX))

如何计算每个组的缺失值数量?我是使用 R 的新手,所以最简单的解决方案更好

【问题讨论】:

    标签: r


    【解决方案1】:

    我们可以得到用is.na创建的逻辑向量的sum

    library(dplyr)
    data%>%
      group_by(variable1,variable2)%>%
      summarise(Mean = mean(variableXXX, na.rm = TRUE),
               MissingCount = sum(is.na(variableXXX)))
    

    注意:假设我们对按“variable1”和“variable2”分组的“variableXXX”列中NAs 的计数感兴趣


    如果我们需要整个数据集子集的 NA 计数

    library(purrr)
    data %>% 
        group_split(variable1, variable2) %>%
        map_dfr(~ .x %>%
               summarise(Mean = mean(variableXXX, na.rm = TRUE), 
                         MissingCount = sum(is.na(.))))
    

    【讨论】:

    • 我想获得变量 XXX 的 NA 数,以及每组中所有观察值的 NA 数
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-11-16
    • 2020-11-14
    • 1970-01-01
    • 2020-08-28
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多