【发布时间】:2019-12-20 04:16:11
【问题描述】:
我用create table t(name string, age int) stored as parquet 创建了一个配置单元表。
然后我插入一些数据,有的使用gzip压缩,有的使用snappy压缩。即对应的HDFS目录下有gzip文件和snappy文件。
查询时看到gzip和snappy中的数据都被查询出来了,我的问题是Hive在处理文件的时候是如何检测到使用的是哪个压缩编解码器?
【问题讨论】:
标签: hadoop hive compression