【发布时间】:2019-08-14 10:30:11
【问题描述】:
我有一个如下的数据框:
+---------+--------+-------+
|date |id |typ_mvt|
+---------+--------+-------+
|date_1 |5697 |C |
|date_2 |5697 |M |
|date_3 |NULL |M |
|date_4 |NULL |S |
+---------+--------+-------+
我想恢复 id (NULL) 值如下:
+---------+--------+-------+
|date |id |typ_mvt|
+---------+--------+-------+
|date_1 |5697 |C |
|date_2 |5697 |M |
|date_3 |5697 |M |
|date_4 |5697 |S |
+---------+--------+-------+
有没有办法做到这一点?
感谢您的回答。
【问题讨论】:
-
你需要更具体的要求,ID是不是一直不变的,是不是每列有空就填5697?
-
次要问题:您为什么特别想要基于 UDF 的解决方案?这是您的要求,还是您可以采取任何其他方式?
标签: scala dataframe apache-spark