【发布时间】:2021-09-11 01:23:55
【问题描述】:
有没有办法删除只包含空值的 spark dataFrame 的列? (我使用的是 scala 和 Spark 1.6.2)
目前我正在这样做:
var validCols: List[String] = List()
for (col <- df_filtered.columns){
val count = df_filtered
.select(col)
.distinct
.count
println(col, count)
if (count >= 2){
validCols ++= List(col)
}
}
构建包含至少两个不同值的列列表,然后在 select() 中使用它。
谢谢!
【问题讨论】:
标签: scala null spark-dataframe