【发布时间】:2015-02-09 18:27:58
【问题描述】:
如果我有一个二进制数据文件(可以转换为 csv 格式),有没有办法直接从它加载 parquet 表?许多教程显示将 csv 文件加载到文本表,然后从文本表加载到 parquet 表。从效率的角度来看,是否可以直接从我已经拥有的二进制文件中加载镶木地板表?理想情况下使用创建外部表命令。 还是我需要先将其转换为 csv 文件?有文件格式限制吗?
【问题讨论】:
-
昨天我使用 apache Drill 生成的 parquet 文件创建了一个外部表。
标签: hadoop cloudera-cdh impala parquet