【发布时间】:2022-01-22 22:51:03
【问题描述】:
我有一个如下所示的数据框,其中包含键和值对。
| Name | Age | Location
| abc | 12 | loc1
| def | 13 | loc2
我想用它创建一个 json 字符串。当我执行.toJSON() 并收集时,我会从该数据帧中获取以下 json 字符串
[{"name":"abc","age":12,"location":"loc1"},{"name":"def","age":13,"location":"loc2"}]
是否可以只获取 json 的值部分而不是获取如下所示的键?
预期输出:
[{"abc",12,"loc1"},{"def",13,"loc2"}]
我用来将数据帧转换为 json 的代码
df.toJSON().collect()
如果我们能在 PYSPARK 中得到一些解决方案,那就太好了。
【问题讨论】:
标签: json apache-spark pyspark apache-spark-sql spark-structured-streaming