计算R中组中缺失值的数量

【问题标题】：Count the number of missing values in groups in R计算R中组中缺失值的数量
【发布时间】：2020-04-26 19:43:20
【问题描述】：

我有一个小标题，有很多观察和变量。

我要做的只是计算（按变量 1 和变量 2 分组）变量 XXX 的平均值，以及每组缺失值的总数。

这是我目前所写的：

 data%>%
      group_by(variable1,variable2)%>%
      summarise(mean(variableXXX))

如何计算每个组的缺失值数量？我是使用 R 的新手，所以最简单的解决方案更好

【问题讨论】：

标签： r

【解决方案1】：

我们可以得到用is.na创建的逻辑向量的sum

library(dplyr)
data%>%
  group_by(variable1,variable2)%>%
  summarise(Mean = mean(variableXXX, na.rm = TRUE),
           MissingCount = sum(is.na(variableXXX)))

注意：假设我们对按“variable1”和“variable2”分组的“variableXXX”列中NAs 的计数感兴趣

如果我们需要整个数据集子集的 NA 计数

library(purrr)
data %>% 
    group_split(variable1, variable2) %>%
    map_dfr(~ .x %>%
           summarise(Mean = mean(variableXXX, na.rm = TRUE), 
                     MissingCount = sum(is.na(.))))

【讨论】：

我想获得变量 XXX 的 NA 数，以及每组中所有观察值的 NA 数