【问题标题】:Calculate percentage of missing string variables in each column计算每列中缺失字符串变量的百分比
【发布时间】:2015-12-08 23:25:45
【问题描述】:

我有一个数据框,其中一些列是缺少值的字符串。有没有办法(使用 dplyr)有效地计算每列缺失的百分比,即“”。所以我不必单独计算每列丢失的百分比?

我尝试了以下方法,但似乎没有用

library(dplyr) 
#Create data frame

a<- c(1,"",3,4)
b<- c(2,2,3,4)
c <- c("",2,"",3)
x<- data.frame(a,b,c)

x %>% 
summarise_each(funs(100*mean(is.null(.))))

#Result is
#a b c
#0 0 0

想要得到类似的东西

#a    b c
#0.75 0 0.50

【问题讨论】:

  • "" 不是NULL。这是一个空字符串。非常不一样。一个简单的提示是 "" == "" 的计算结果为 TRUE

标签: r dplyr


【解决方案1】:

在基地:

colSums(x!="")/nrow(x)
   a    b    c 
0.75 1.00 0.50 

【讨论】:

    猜你喜欢
    • 2022-08-23
    • 1970-01-01
    • 1970-01-01
    • 2023-03-22
    • 1970-01-01
    • 1970-01-01
    • 2020-03-15
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多