【发布时间】:2021-07-22 17:58:21
【问题描述】:
我有一个 Spark (2.4) DataFrame,我想将其编写为管道分隔文件。它应该很简单,像这样
val myDF = spark.table("mySchema.myTable")
myDF.coalesce(1).write.format("csv").options("header", "true").options("delimiter", "|").save("/tmp/myDF")
我在/tmp/myDF 中获得了一个part-*.csv 文件。
到目前为止,一切都很好。但我实际上希望文件名是特定的,例如/tmp/myDF.csv
但是在save 中提供这个字符串只会创建一个名为myDF.csv 的目录并在其中创建part*.csv 文件。
有没有办法用特定名称编写 DataFrame?
【问题讨论】:
标签: scala apache-spark