【发布时间】:2015-01-28 20:48:22
【问题描述】:
我有来自 Netezza 表的 sqoopd 数据,输出文件在 HDFS 中,但有一列是时间戳,我想将其作为日期列加载到我的配置单元表中。使用该列我想在日期创建分区。我该怎么做?
示例:HDFS 中的数据就像 = 2013-07-30 11:08:36
在 hive 中,我只想加载日期 (2013-07-30) 而不是时间戳。我想每天对该列进行分区。
如何动态地按列传递分区?
我尝试将数据加载到一个表中作为源。在最终表中,我将通过 (date_column=dynamic date) select * from table1 插入覆盖表分区
【问题讨论】: