【发布时间】:2019-02-05 13:49:22
【问题描述】:
我有一个问题,有 2 个表(临时)A 和 B,A 有 127 行,B 有大约 2874561 行。
尝试
SELECT A.COL1, B.COL2
FROM A LEFT JOIN B
WHERE A.DATE BETWEEN B.ALLOW_D AND B.SEL_D
在 mr 上执行和运行需要花费大量时间。
也尝试过 Tez、MAPJOIN、STREAMTABLE ...
set mapreduce.input.fileinputformat.split.maxsize=71582788;
set mapreduce.input.fileinputformat.split.minsize=71582788;
但没有运气。
【问题讨论】: