【发布时间】:2020-06-29 18:59:53
【问题描述】:
我在 HDFS 中有 customer_input_data.tar.gz,其中有 10 个不同的 csv 文件格式的表数据。所以我需要使用 spark scala 将此文件解压缩到 /my/output/path
请建议如何使用 spark scala 解压缩 customer_input_data.tar.gz 文件
【问题讨论】:
-
试试这个链接,它可以给你一些答案:stackoverflow.com/questions/36604145/…
-
感谢您发送有用的链接。致力于我赢得的解决方案。会更新
标签: scala apache-spark pyspark apache-spark-sql