【发布时间】:2011-02-24 00:14:13
【问题描述】:
我正在寻找一个基于 Hadoop 的研究/实施项目,我发现了发布在 wiki 页面上的列表 - http://wiki.apache.org/hadoop/ProjectSuggestions。但是,此页面最后一次更新是在 2009 年 9 月。所以,我不确定其中一些想法是否已经实施。我对“MR 框架中的排序和随机播放优化”特别感兴趣,其中谈到“在随机播放之前组合机架或节点上的几个地图的结果。这可以减少搜索工作和中间存储”。
以前有人试过吗?这是在当前版本的 Hadoop 中实现的吗?
【问题讨论】: