【发布时间】:2016-05-06 22:41:19
【问题描述】:
我在 HDFS 中有多个 zip 文件,其中包含两种类型的文件(A.csv & B.csv)
HDFS 位置
/data/jan.zip --> contains A.csv & B.csv
/data/feb.zip --> contains A.csv & B.csv
我想将文件提取到 HDFS 位置,如下所示
/data/jan/A.csv
/data/jan/B.csv
/data/feb/A.csv
/data/feb/B.csv
我正在任何技术(spark、pig、hive、..)中寻找类似下面的命令
hadoop fs -unzip hdfs://..../abc.zip
【问题讨论】:
-
我尝试了博客中给出的命令,但没有成功。它正在创建一些带有 zip 文件头和随机字符的 txt 文件
标签: python hadoop apache-spark mapreduce apache-pig