你可以使用summarise_each:
df1 %>%
group_by(Z) %>%
summarise_each(funs(sum(is.na(.))))
#Source: local data frame [5 x 4]
#
# Z X1 X2 X3
# (fctr) (int) (int) (int)
#1 A 169 77 334
#2 B 170 77 316
#3 C 159 78 348
#4 D 181 79 326
#5 E 174 69 341
请注意,您可以在summarise_each 中指定将函数应用于哪些列(默认是除分组列之外的所有列)或函数应该不应用于哪些列。您可能还需要注意,就像 summarise_each 到 summarise,如果您想在不汇总结果的情况下将函数应用于所有列,还有 mutate_each 作为 mutate 的补充。
强制性 data.table 等效项是:
library(data.table)
setDT(df1)[, lapply(.SD, function(x) sum(is.na(x))), by = Z]
# Z X1 X2 X3
#1: D 181 79 326
#2: C 159 78 348
#3: B 170 77 316
#4: A 169 77 334
#5: E 174 69 341
在基础 R 中,您可以使用如下拆分/应用/组合方法:
do.call(rbind,
lapply(
split(df1, df1$Z), function(dd) {
colSums(is.na(dd[-1]))
}))
# X1 X2 X3
#A 169 77 334
#B 170 77 316
#C 159 78 348
#D 181 79 326
#E 174 69 341
或者,同样在基础 R 中,您可以使用 aggregate:
aggregate(df1[-1], list(df1$Z), FUN = function(y) sum(is.na(y)))
aggregate(. ~ Z, df1, FUN = function(y) sum(is.na(y)), na.action = "na.pass") # formula interface