【问题标题】:Hadoop archive file not deleting source filesHadoop存档文件不删除源文件
【发布时间】:2017-09-09 20:22:21
【问题描述】:

我有一个包含大量小文件的源文件夹。我想将所有文件打包到 Hadoop Encryption Zone 中的单个文件或容器中。

hadoop archive -archiveName test.har -p /user/source /user/outputdir

上述命令将在 outputdir 中创建一个 .har 文件。但是源文件夹中的文件仍然存在。

有没有一种方法可以删除源文件夹中存在的所有小文件并创建一个存档文件。如果是,如何解压并取回源文件?

【问题讨论】:

    标签: hadoop hdfs


    【解决方案1】:

    即使创建了存档文件,源文件仍然存在。唯一的解决方案是从 hadoop 加密区域中删除文件。

    hadoop fs -rm -r -skipTrash /user/source/*.*
    

    关于取消归档:

    hdfs dfs -cp /user/outputdir/test.har /user/new_destination
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2013-05-23
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-01-25
      相关资源
      最近更新 更多