【发布时间】:2017-05-11 12:48:09
【问题描述】:
我有一个场景,Spark 从输入文件推断架构并使用整数数据类型写入 parquet 文件。
但是我们在 hive 中有表,其中字段定义为 BigInt。现在没有从 int 到 long 的转换,并且 hive 会抛出无法将 Integer 转换为 Long 的错误。我无法将 Hive DDL 编辑为整数数据类型,因为将这些字段设为 Long 是业务要求。 我已经查找了我们可以在保存之前转换数据类型的选项。除了我有数百列并且显式转换使代码非常混乱之外,可以这样做。
有没有办法告诉 spark 自动转换数据类型。
【问题讨论】:
标签: apache-spark types hive