【发布时间】:2019-09-26 06:49:21
【问题描述】:
我有一个嵌套的 JSON,我需要在其中转换为展平的 DataFrame,而无需在其中定义或分解任何列名。
val df = sqlCtx.read.option("multiLine",true).json("test.json")
这就是我的数据的样子:
[
{
"symbol": “TEST3",
"timestamp": "2019-05-07 16:00:00",
"priceData": {
"open": "1177.2600",
"high": "1179.5500",
"low": "1176.6700",
"close": "1179.5500",
"volume": "49478"
}
},
{
"symbol": “TEST4",
"timestamp": "2019-05-07 16:00:00",
"priceData": {
"open": "189.5660",
"high": "189.9100",
"low": "189.5100",
"close": "189.9100",
"volume": "267986"
}
}
]
【问题讨论】:
-
您使用的是哪个版本的
Spark? -
spark 版本 = 2.3.0
标签: scala apache-spark apache-spark-sql spark-streaming