【发布时间】:2017-03-15 19:17:08
【问题描述】:
我正在执行一个 map reduce 作业,该作业正在处理来自 hbase 表的 30 行(MAP_INPUT_RECORDS=30)。该表有 11000 个区域,但在任何时候,一条记录将仅根据我们的区域拆分策略位于单个区域中(即单个记录不会在 2 个或更多区域中)。在这里,我在日志中获得了更多数量的映射器 65(TOTAL_LAUNCED_MAPS=65)。根据 hbase 文档,将为每个区域分配一个映射器。但就我而言,映射器的数量超过了区域。提出一些解决方案。提前致谢。
【问题讨论】: