【发布时间】:2020-04-11 19:28:29
【问题描述】:
我有一个 pyspark 数据框列,其中包含如下数据。
Column 1
A1,A2
B1
C1,C2
D2
我必须根据逗号将列拆分为 2 列。输出应该如下。
Column 1 Column 2
A1 A2
B1
C1 C2
D2
我尝试使用 split() 函数,但我的 B1 和 D2 被填充到第 1 列而不是第 2 列。有没有办法实现上述输出?
【问题讨论】:
-
你已经固定了 2 列或者它可能是 N 项?
-
固定2列
标签: python apache-spark pyspark