【发布时间】:2012-01-16 21:08:24
【问题描述】:
我是 Hadoop 的新手,我正在尝试弄清楚它是如何工作的。至于练习,我应该实现类似于 WordCount-Example 的东西。任务是读取几个文件,进行 WordCount 并为每个输入文件编写一个输出文件。 Hadoop 使用组合器并将 map-part 的输出打乱作为 reducer 的输入,然后写入一个输出文件(我猜是每个正在运行的实例)。我想知道是否可以为每个输入文件编写一个输出文件(所以保留 inputfile1 的单词并将结果写入 outputfile1 等等)。是否可以覆盖 Combiner-Class 或者是否有其他解决方案(我不确定这是否应该在 Hadoop-Task 中解决,但这是练习)。
谢谢...
【问题讨论】: