【发布时间】:2023-03-05 02:09:01
【问题描述】:
我有一个如下所示的数据框
col1
-----------------
[a1_b1_c1, a2_b2_c2, a3_b3_c3]
[aa1_bb1_cc1, aa2_bb2_cc2, aa3_bb3]
[aaa2_bbb2_ccc1, aaa2_bbb2_cc2, aaa3_bbb3]
现在我要拆分元素,需要形成下面提到的数据框,
newcol1
--------
[c1,c2,c3]
[cc1,cc2,null]
[ccc1,ccc2,null]
请向我建议实现这一目标的最佳方法?
【问题讨论】:
-
您使用的是哪个版本的 Spark?
-
spark 2.4.4 和 python3
-
@Yeskay 很高兴您发现我的解决方案很有帮助!除了已经接受之外,还请考虑支持它:)
标签: arrays dataframe apache-spark pyspark split