【发布时间】:2019-11-07 06:29:51
【问题描述】:
我有一些 10000 行的数据。我想不按任何列平均拆分它。应该是 2000,2000,2000,2000,2000。我们应该把它写成每个 2000。
尝试合并 而且我也尝试过分区。但分布不均。
final.coalesce(4).write.mode('overwrite').option("header", "true")
【问题讨论】:
-
我已经使用了重新分区并检查了..我们仍然得到不同大小的文件..你能建议我平等地得到它吗