【发布时间】:2014-01-31 14:01:07
【问题描述】:
我是 Hadoop 的初学者。我已经建立了字数统计,并且我相当确定我了解基础知识,但我无法将其扩展到实际问题。我的(修改后的)代码如下:
for (Item i : set) {
for (Item j : set) {
Score s = score(i, j);
renderer.render(s);
}
}
我想使用 Hadoop 来分发它。我可以编写 Mapper 和 Reducer,但我不知道如何将集合传递给 Mapper 并将渲染器传递给 Reducer(或者如果这甚至是处理此问题的惯用方式)。我也觉得我需要编写自己的 Writable 来处理在 Mapper 和 Reducer 之间传递 (i, j) 对,但我不知道最好的方法。任何帮助将不胜感激。
【问题讨论】: