【发布时间】:2023-03-31 07:05:02
【问题描述】:
我正在使用 azure databricks 开发一个项目,我需要将转换后的 JSON 格式数据写入文件 (.json),然后再写入 DB。
我已经尝试过使用数据框、rdd 选项。我尝试过的一些sn-ps
df.collect.map( line => {
//transformation logic to create json
(field1,field2,json);
})
var dataframe = processedList.toList.toDF("f1","f2","json");
dataframe .repartition(1).write.mode("overwrite").json(path)
此代码工作正常,但作为 json 数据的“值”被视为/写入为字符串,因为它包含所有转义字符等。不能直接使用 JsonObject,因为数据框不支持它。
那么有没有办法在不转换为字符串的情况下写入文件?
【问题讨论】:
标签: json scala apache-spark apache-spark-sql databricks