【发布时间】:2021-06-30 11:11:42
【问题描述】:
我有一个 pyspark 数据框,其中一列的格式如下:
[{key1: value1},{key2:value2}, {key3:value3}, {key4:value4}]
让我们将其称为 ColumnY,如下所示:
| ColumnY |
|---|
| [{key1: value1},{key2:value2}, {key3:value3}, {key4:value4}] |
我想将其转换为数据框的列,其中列名为 keyX,其内容为 valueX,其中 X=[1,4] 如下:
| key 1 | key 2 | key 3 | key 4 |
|---|---|---|---|
| value1 | value2 | value3 | value4 |
我尝试了一些解决方案,但没有奏效。如果有的话,请您分享任何想法或解决方案。提前谢谢你。
【问题讨论】:
标签: python json apache-spark pyspark apache-spark-sql