【发布时间】:2013-07-23 09:13:46
【问题描述】:
我有一个关于 Hive 查询执行的问题。
假设我有一个查询:
从 id > 5 的表中选择 *;
现在这个查询被转换成一棵树,然后分割成更小的任务并分发到具有该特定数据的数据节点。
现在,当查询被分发时,整个查询是否会分发到所有拥有数据的节点?还是只向节点发送部分查询?
如果将整个查询发送到所有节点,数据节点是只处理部分查询还是整个查询?
如果是上述情况,那么数据节点processi有什么用
【问题讨论】:
-
“当查询被分发时”是什么意思?
-
我的意思是查询被分成小任务,对吧?当它们分布在有数据的节点之间时,会发生什么?