【发布时间】:2017-08-15 20:49:26
【问题描述】:
我有一个包含 75 列的数据框,其中 12 列具有所有 NA,有些具有 70% 的 NA。我想删除具有 >=70% NA 的列。
任何人都可以帮助我吗?我试过了
df[,! apply( df , 2 , function(x) all(is.na(x)) )
但我得到了例外:
错误:无法从 NULL 类的对象中检索 spark_connection
我也试过了:
df[colSums(!is.na(df)) != nrow(df)]
和
df[, colSums(is.na(df)) < nrow(df)]
但是我遇到了异常
colSums(!is.na(df)) 中的错误:“x”必须是至少二维的数组
【问题讨论】:
标签: r apache-spark dplyr sparklyr