【发布时间】:2017-08-25 00:53:40
【问题描述】:
我们有 2 个集群,一个是 Map R,另一个是我们自己的。我们希望使用 Map R 数据在我们自己的硬件中创建新设置。
- 我已经从 Map R 集群中复制了所有的 orc 文件并遵循相同的文件夹结构
- 创建了一个位置为 #1 的兽人格式表
- 然后执行这个命令“MSCK REPAIR TABLE ”
上述步骤顺利通过,但当我查询分区时,作业失败并出现以下错误
java.lang.IllegalArgumentException: Buffer size too small. size = 262144 needed = 4958903
at org.apache.hadoop.hive.ql.io.orc.InStream$CompressedStream.readHeader(InStream.java:193)
at org.apache.hadoop.hive.ql.io.orc.InStream$CompressedStream.read(InStream.java:238)
谁能告诉我我们可以直接从 orc 文件创建 HIVE ORC 分区表吗?
我的存储是 Azure 数据湖。
【问题讨论】:
标签: azure hadoop hive mapreduce hiveql