【发布时间】:2019-10-11 07:31:38
【问题描述】:
我有一个 spark 数据框,其中几列为空。我需要创建一个新的数据框,添加一个新列“error_desc”,该列将提及每行具有空值的所有列。我需要在不提及每个列名的情况下动态执行此操作。
例如:如果我的数据框低于
+-----+------+------+
|Rowid|Record|Value |
+-----+------+------+
| 1| a| b|
| 2| null| d|
| 3| m| null|
+-----+------+------+
我的最终数据框应该是
+-----+------+-----+--------------+
|Rowid|Record|Value| error_desc|
+-----+------+-----+--------------+
| 1| a| b| null|
| 2| null| d|record is null|
| 3| m| null| value is null|
+-----+------+-----+--------------+
【问题讨论】:
-
您能否提供示例输入数据框并将其格式化为代码,以便我们了解您的问题。
-
Rowid 记录值 1 a b 2 null d 3 m null
-
我已经编辑了你的问题格式以便更好地理解,请提交
-
@Nikk 完成.. 你能帮忙吗?
-
这些值来自我动态读取的文件..所以我不想在代码中写列名..
标签: apache-spark apache-spark-sql