【发布时间】:2017-03-13 06:00:42
【问题描述】:
我现在正准备将 .csv 文件中的数据存储到 hive 中。当然,由于 parquet 文件格式的性能好,hive 表应该是 parquet 格式。所以,正常的做法是创建一个格式为textfile的临时表,然后我将本地CSV文件数据加载到这个临时表中,最后创建一个相同结构的parquet表并使用sqlinsert into parquet_table values (select * from textfile_table);。
但我不认为这个临时文本文件表是必要的。所以,我的问题是,有没有办法让我将这些本地 .csv 文件直接加载到 hive parquet-format 表中,即不使用临时表?或者更简单的方法来完成这项任务?
【问题讨论】: