【发布时间】:2019-04-21 04:40:14
【问题描述】:
我想在 spark scala 中计算数据框每一行中缺失值的数量。
代码:
val samplesqlDF = spark.sql("SELECT * FROM sampletable")
samplesqlDF.show()
输入数据框:
------------------------------------------------------------------
| name | age | degree | Place |
| -----------------------------------------------------------------|
| Ram | | MCA | Bangalore |
| | 25 | | |
| | 26 | BE | |
| Raju | 21 | Btech | Chennai |
-----------------------------------------------------------------
输出数据帧(Row Level Count)如下:
-----------------------------------------------------------------
| name | age | degree | Place | rowcount |
| ----------------------------------------------------------------|
| Ram | | MCA | Bangalore | 1 |
| | 25 | | | 3 |
| | 26 | BE | | 2 |
| Raju | 21 | Btech | Chennai | 0 |
-----------------------------------------------------------------
我是 scala 和 spark 的初学者。提前致谢。
【问题讨论】:
-
嗨,欢迎来到 StackOverflow。您可以查看this link - how to ask 以改进未来的问题。特别是,您应该提供一些研究工作和/或一些代码来探测您已经尝试过自己解决问题。
-
嗨,看看解决方案怎么样?
标签: scala apache-spark apache-spark-sql spark-streaming