【发布时间】:2018-12-06 18:58:08
【问题描述】:
数据是这样的——
+-----------+-----------+-----------------------------+
| id| point| data|
+-----------------------------------------------------+
| abc| 6|{"key1":"124", "key2": "345"}|
| dfl| 7|{"key1":"777", "key2": "888"}|
| 4bd| 6|{"key1":"111", "key2": "788"}|
我正在尝试将其分解为以下格式。
+-----------+-----------+-----------+-----------+
| id| point| key1| key2|
+------------------------------------------------
| abc| 6| 124| 345|
| dfl| 7| 777| 888|
| 4bd| 6| 111| 788|
explode 函数将数据框分解为多行。但这不是理想的解决方案。
注意:此解决方案无法回答我的问题。 PySpark "explode" dict in column
【问题讨论】:
标签: python apache-spark pyspark apache-spark-sql