【发布时间】:2020-05-15 08:16:54
【问题描述】:
我是 Spark 的初学者,我正在为我的问题寻找解决方案。 我正在尝试根据每列包含的 null 值 的数量按升序对数据框进行排序。
例如: 数据:
column1 Column2 Column3
a d h
b null null
null e i
null f h
null null k
c g l
排序后的dataframe应该是:
Column3 Colum2 Column1
我所能做的就是计算每一列的空值。
data.select([count(when(col(c).isNull(), c)).alias(c) for c in data.columns])
现在,我不知道如何继续。我希望你能帮助我。
【问题讨论】:
标签: python dataframe pyspark pyspark-sql