【发布时间】:2016-10-25 05:17:44
【问题描述】:
我有一个包含不同年龄段公司员工数据的用例。 我需要找到三个年龄段的男性和女性员工的最高工资。
详情请看以下链接 -
http://www.myhadoopexamples.com/2014/03/01/hadoop-mapreduce-example-with-partitioner/
我的问题是 - 这里我们只有两个由映射器发出的键,即男性和女性。 我们在驱动类中设置了 3 个 reducer,因此将创建 3 个分区。
下面可能有两件事 -
将为每个 3 个分区运行 3 个减速器,这反过来会发现 每个partner的最高女性和男性工资。并给出如上链接所示的预期结果。
只有reducer实际运行,一公一母并进行计算
【问题讨论】:
-
你到底想要什么??
-
运行时会创建多少个reducer?它会一次创建每个分区器的 3 个减速器和服务器数据并处理输出还是只处理 2 个减速器,因为映射器只有两个键。
-
这不是大约 24 小时内第三次被问到这个问题吗? stackoverflow.com/questions/37972288/… 和 stackoverflow.com/questions/37983319/number-of-reducer
标签: mapreduce reducers partitioner