【发布时间】:2016-08-03 11:33:44
【问题描述】:
我正在为一个客户工作,我应该使用 Snappy 压缩将一些文件放入 HDFS。我的问题是在 mapred-site.xml 或 hdfs-site.xml 中没有定义 snappy 编解码器
不知何故,我必须最好使用hdfs put 命令来放置文件,并且它们应该被压缩。没有机会更改配置文件,因为它是生产机器并且其他人正在积极使用它。
另一个建议的解决方案是将文件导入 HDFS 而不进行压缩,然后创建带压缩的配置单元外部表,并在删除未压缩文件的同时使用其源文件。但这还有很长的路要走,而且不能保证一定会奏效。
任何关于使用带有某种参数的hdfs put 来压缩文件的建议都将不胜感激。
【问题讨论】:
-
这是不可能的,
put只是移动数据。
标签: hadoop compression hdfs snappy