【发布时间】:2016-11-21 16:43:16
【问题描述】:
我有一个如下所示的数据框
Id Date Col1 Col2 Col3 Col4
30 2012-03-31 A42.2 20.46 NA
36 1996-11-15 NA V73 55
96 2010-02-07 X48 Z16 13
40 2010-03-18 AD14 20.12 36
69 2012-02-21 22.45
11 2013-07-03 81 V017 TCG11
22 2001-06-01 67
83 2005-03-16 80.45 V22.15 46.52 X29.11
92 2012-02-12
34 2014-03-10 82.12 N72.22 V45.44
我正在尝试计算每行中NA 或 空单元格 的数量,最终预期输出如下
Id Date Col1 Col2 Col3 Col4 MissCount
30 2012-03-31 A42.2 20.46 NA 2
36 1996-11-15 NA V73 55 2
96 2010-02-07 X48 Z16 13 1
40 2010-03-18 AD14 20.12 36 1
69 2012-02-21 22.45 3
11 2013-07-03 81 V017 TCG11 1
22 2001-06-01 67 3
83 2005-03-16 80.45 V22.15 46.52 X29.11 0
92 2012-02-12 4
34 2014-03-10 82.12 N72.22 V45.44 1
最后一列MissCount 将存储NAs 的数量或每行的空单元格。非常感谢任何帮助。
【问题讨论】:
-
可能像
rowSums(is.na(df) | df == "")这样的东西会做 -
它可以在输入阶段通过
read.table("filename",sep=",",na.strings=c("",,NA),stringsAsFactors=FALSE)解决,这将只产生 NA 值,您可以使用 @DavidArenburg 解决方案来计算所有 NA
标签: r count missing-data