【发布时间】:2018-10-18 17:25:53
【问题描述】:
我有一个带有字符串类型列的 DataFrame,这个字符串是 JSON 格式,我想根据这个 JSON 格式将此列转换为多个列。如果我有 JSON 模式,我可以做到,但我没有。
示例:
原始数据框:
---------------------
| json_string|
---------------------
|{"a":2,"b":"hello"}|
| {"a":1,"b":"hi"}|
---------------------
转换/解析后
--------------
| a | b |
--------------
| 2 | hello|
| 1 | hi|
--------------
我使用的是 Apache Spark 2.1.1。
【问题讨论】:
标签: json scala apache-spark apache-spark-sql