【发布时间】:2017-10-10 07:21:00
【问题描述】:
我有一个 json 文件,在 spark.read.json 之后,其中一列(名称:js)具有以下格式:
{"pp":1,"its":"[{"def":false, "val":3},{"def":true, "val":2},...]"}
我需要将“its”分解,这样我才能知道每个def,以及里面的每个val,并且defs和vals的数量是不确定的。
当我阅读它时,使用
val df = tmp.select($"js.its")
df 是字符串的 DataFrame。我可以将它转换回 Array 以便我可以使用 explode 或任何其他方式来了解所有 defs 值和所有 vals 值吗?
非常感谢
【问题讨论】:
标签: arrays json scala apache-spark