【发布时间】:2017-05-09 00:18:24
【问题描述】:
我正在尝试使用 hive 生成一些 parquet 文件,为此我从一些 .tbl 文件中加载了一个常规 hive 表,通过 hive 中的这个命令:
创建表区域 ( R_REGIONKEY BIGINT, R_NAME STRING, R_COMMENT STRING)
行格式分隔 以“|”结尾的字段 存储为文本文件 位置'/tmp/tpch-generate';
在此之后我只执行这 2 行:
create table parquet_reion LIKE region STORED AS PARQUET;
插入parquet_region select * from region;
但是当我检查在 HDFS 中生成的输出时,我没有找到任何 .parquet 文件,而是找到了像 0000_0 到 0000_21 这样的文件名,并且它们的大小总和比原始 tbl 文件大得多。
我做错了什么?
【问题讨论】:
标签: hive hortonworks-data-platform parquet ambari beeline