【发布时间】:2020-04-26 19:43:20
【问题描述】:
我有一个小标题,有很多观察和变量。
我要做的只是计算(按变量 1 和变量 2 分组)变量 XXX 的平均值,以及每组缺失值的总数。
这是我目前所写的:
data%>%
group_by(variable1,variable2)%>%
summarise(mean(variableXXX))
如何计算每个组的缺失值数量?我是使用 R 的新手,所以最简单的解决方案更好
【问题讨论】:
标签: r
我有一个小标题,有很多观察和变量。
我要做的只是计算(按变量 1 和变量 2 分组)变量 XXX 的平均值,以及每组缺失值的总数。
这是我目前所写的:
data%>%
group_by(variable1,variable2)%>%
summarise(mean(variableXXX))
如何计算每个组的缺失值数量?我是使用 R 的新手,所以最简单的解决方案更好
【问题讨论】:
标签: r
我们可以得到用is.na创建的逻辑向量的sum
library(dplyr)
data%>%
group_by(variable1,variable2)%>%
summarise(Mean = mean(variableXXX, na.rm = TRUE),
MissingCount = sum(is.na(variableXXX)))
注意:假设我们对按“variable1”和“variable2”分组的“variableXXX”列中NAs 的计数感兴趣
如果我们需要整个数据集子集的 NA 计数
library(purrr)
data %>%
group_split(variable1, variable2) %>%
map_dfr(~ .x %>%
summarise(Mean = mean(variableXXX, na.rm = TRUE),
MissingCount = sum(is.na(.))))
【讨论】: