【发布时间】:2015-12-08 23:25:45
【问题描述】:
我有一个数据框,其中一些列是缺少值的字符串。有没有办法(使用 dplyr)有效地计算每列缺失的百分比,即“”。所以我不必单独计算每列丢失的百分比?
我尝试了以下方法,但似乎没有用
library(dplyr)
#Create data frame
a<- c(1,"",3,4)
b<- c(2,2,3,4)
c <- c("",2,"",3)
x<- data.frame(a,b,c)
x %>%
summarise_each(funs(100*mean(is.null(.))))
#Result is
#a b c
#0 0 0
想要得到类似的东西
#a b c
#0.75 0 0.50
【问题讨论】:
-
""不是NULL。这是一个空字符串。非常不一样。一个简单的提示是"" == ""的计算结果为TRUE