【发布时间】:2020-06-17 09:07:02
【问题描述】:
我有一个数据:
test_df <- data.frame(x1 = c("a", "b", "c", NA, NA),
x2 = sample(1:5),
x3 = c(T, NA, F, T, NA),
x4 = c(NA, NA, 1, 2, 3),
stringsAsFactors = F)
colset1 <- c("x1", "x2", "x3")
colset2 <- c("x2", "x3", "x4")
包含变量名称的数据框和向量。
如何检查(最好以dplyr 方式),如果向量(colset)中提供的任何列行包含任何NAs?
colset1 的预期答案是 TRUE FALSE TRUE FALSE FALSE,colset2 的预期答案是 FALSE FALSE TRUE TRUE FALSE(最好可以作为新的逻辑变量进行变异,没关系)。
另一个问题是:如何计算那些列中的NAs?
colset1 的预期答案是 0 1 0 1 2,colset2 的预期答案是 1 2 0 0 1
我正在尝试变异 ...ifelse(length(sum(is.na(vars(colset1)))) == 0),但仍然缺少一些东西,它不起作用,我迷失在自己的代码中 :)
谢谢!
【问题讨论】: