【发布时间】:2019-04-24 20:52:30
【问题描述】:
我正在尝试将我的 pyspark sql 数据帧转换为 json,然后另存为文件。
df_final = df_final.union(join_df)
df_final 包含这样的值:
我尝试过这样的事情。但它创建了一个无效的 json。
df_final.coalesce(1).write.format('json').save(data_output_file+"createjson.json", overwrite=True)
{"Variable":"Col1","Min":"20","Max":"30"}
{"Variable":"Col2","Min":"25,"Max":"40"}
我预期的文件应该有如下数据:
[
{"Variable":"Col1",
"Min":"20",
"Max":"30"},
{"Variable":"Col2",
"Min":"25,
"Max":"40"}]
【问题讨论】:
-
试试
df.toJSON()
标签: python-3.x pyspark apache-spark-sql pyspark-sql