【发布时间】:2015-01-17 12:39:36
【问题描述】:
我正在使用 ControlledJobs 在 Hadoop 2.2.0 中实现一系列 MR 作业。基本架构是这样的:
mapper1 -> reducer1 -> mapper2 -> reducer2
但是,mapper2 是身份。有没有办法让reducer1轻松生成key-value-pairs并将它们传递给reducer2?
目前,两轮的作业输出配置如下:
// set intermediate/mapper output
job.setMapOutputKeyClass(Text.class);
job.setMapOutputValueClass(Text.class);
// set reducer output
job.setOutputKeyClass(NullWritable.class);
job.setOutputValueClass(Text.class);
【问题讨论】:
-
如果你也没有给mapper2,默认会执行一个身份映射器