【发布时间】:2020-06-17 17:51:10
【问题描述】:
作为我的数据框的一部分,其中一列具有以下方式的数据
[{"text":"Tea"},{"text":"GoldenGlobes"}]
我想将其转换为字符串数组。
[“茶”、“金球奖”]
有人请告诉我,如何做到这一点?
【问题讨论】:
-
你可以使用
from_json(),用ArrayType()创建一个schema,并选择text命名的字段。 .使用方法见here示例
标签: apache-spark dataframe pyspark apache-spark-sql