【发布时间】:2018-01-08 11:01:48
【问题描述】:
使用sqoop导入单表
...
--as-avrodatafile
--compression-codec ...SnappyCodec
...
在 Hue 文件浏览器中查看通过显示消息 Output rendered from compressed avro file. 来确认它已被压缩
在 Hive 中创建外部表
create external table customers_avro
stored as avro
location '.../path/'
tblproperties('avro.schema.file'='/path/to/customers.avsc')
但是,当使用describe extended tblname 查询时显示compressed:false
...
inputFormat:org.apache.hadoop.hive.ql.io.avro.AvroContainerInputFormat, outputFormat:org.apache.hadoop.hive.ql.io.avro.AvroContainerOutputFormat, compressed:false, numBuckets:-1, serdeInfo:SerDeInfo(name:null, serializationLib:org.apache.hadoop.hive.serde2.avro.AvroSerDe, parameters:{serialization.format=1})...
还有其他属性需要设置tblproperties吗?
【问题讨论】: