【发布时间】:2016-12-11 23:30:59
【问题描述】:
我正在尝试(在 s3 上创建 parquet hive 表失败)。
create external table sequencefile_s3
(user_id bigint,
creation_dt string
)
stored as sequencefile location 's3a://bucket/sequencefile';
序列文件完美运行。
create external table parquet_s3
(user_id bigint,
creation_dt string)
stored as parquet location 's3a://bucket/parquet';
insert into parquet_s3
select * from hdfs_data;
镶木地板不起作用。 这些文件是在 S3 存储桶/文件夹上创建的,select count(*) 有效,但是 select * from parquet_s3 limit 10 无效。
其他说明 我在 AWS 或 EC2 之外运行 cloudera 发行版 5.8。 S3a 配置正确(我可以通过 distcp 复制文件,并且 s3 序列文件和文本文件外部表工作正常)。
【问题讨论】:
标签: amazon-s3 hive cloudera-cdh parquet