【发布时间】:2021-12-30 21:51:34
【问题描述】:
我有以下数据框,其中有一列 sig 和 N 其他列。
sig 包含嵌入其中的N 列数,如下所示。嵌入的列名称可以是数据框中存在的任意数字。
我想用其他列中的相应值更新sig 列。
例如,
+---------------------------------------------------------------------+------------+------------------+-------------------+--------+
|sig |order_timing|po_manl_create_ind|mabd_arrival_status|cut_time|
+---------------------------------------------------------------------+------------+------------------+-------------------+--------+
|R1:BR1-order_timing:BR2-po_manl_create_ind:BR3-mabd_arrival_status:R1|14 |0 |late |23 |
|R1:BR1-order_timing:BR2-po_manl_create_ind:BR7-cut_time:R1 |14 |0 |on_time |10 |
预期输出
+---------------------------------------------------------------------+------------+-----
|sig |order_timing|po_manl_create_ind|mabd_arrival_status|cut_time|
+---------------------------------------------------------------------+------------+-----
|R1:BR1-14:BR2-0:BR3-late:R1|14 |0 |late |23 |
|R1:BR1-14:BR2-0:BR7-10:R1 |14 |0 |on_time |10 |
【问题讨论】:
标签: scala apache-spark apache-spark-sql