【发布时间】:2016-08-08 01:34:19
【问题描述】:
目前,insert overwrite table T1 select * from T2; 在我的集群中大约需要 100 分钟。 Table T1 is ORC 格式化和 T2 is text 格式化。我正在从 T2 读取 60 GB 的文本数据并插入 ORC 表 T1(插入后为 10 GB)。如果我对两个表格都使用文本格式,则插入大约需要 50 分钟。在这两种情况下,我们可以做些什么来提高写入速度(我有大表进来)或任何其他建议??
【问题讨论】:
标签: hadoop hive hadoop2 beeline