【发布时间】:2016-09-18 07:52:34
【问题描述】:
我目前正在使用 Cloudera 5.6 尝试基于另一个表在 hive 表中创建 parquet 格式表,但我遇到了错误。
create table sfdc_opportunities_sandbox_parquet like
sfdc_opportunities_sandbox STORED AS PARQUET
错误信息
Parquet does not support date. See HIVE-6384
我读到 hive 1.2 已修复此问题,但 Cloudera 5.6 和 5.7 不附带 hive 1.2。有没有人找到解决这个问题的方法?
【问题讨论】:
-
我猜到那时你已经弄清楚了?如果您可以使用 spark 数据框,则没有问题,但我自己在某些情况下需要使用 Hive,除了编写
long类型然后转换为view之外,我没有找到任何解决方法。 -
将日期列设为字符串或时间戳。我认为没有其他选择。
-
我已经使用时间戳一年了。
-
假设您仍然必须使用
timestamp? -
我们使用的是更新版本的 CDH,但我们没有更改 ETL 流程,所以是的,我们仍然使用时间戳。但我们正在慢慢离开 CDH