【问题标题】:How does MapReduce framework implement the sort phase?MapReduce 框架如何实现排序阶段?
【发布时间】:2012-02-20 15:36:13
【问题描述】:

我对 MapReduce 排序阶段的实现感兴趣;它似乎非常有效。有人可以提供一些关于它的参考吗?谢谢!

【问题讨论】:

    标签: sorting frameworks hadoop mapreduce implementation


    【解决方案1】:

    This 指向ReduceTask.java 作为排序阶段编码的地方。请参阅ReduceTask.java 中的第 393-408 行。如果您需要更多信息,请download the entire source 并深入了解。

    已编辑

    “排序”阶段属于ReduceTask,如下图hadoop book所示。 (页码:163)

    【讨论】:

    • 注意:排序实际上发生在映射器之后。 reducer 只是合并排序的段。
    • @ThomasJungblut:见上图。
    • @ThomasJungblut 排序发生在 map() 方法的输出和 reducer 从多个映射器获得的输入上。后者被称为“排序阶段”(如图所示)。
    • 排序与要映射的输出并行,但排序阶段仍然只是一个合并阶段。所以命名是误导。这就是我的意图(几个月前)。
    猜你喜欢
    • 2022-01-22
    • 2017-12-30
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-09-06
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多