【发布时间】:2016-03-02 05:02:01
【问题描述】:
我只是 Hadoop 框架的初学者。我想在这里了解几个概念,我浏览了很多链接,但我想得到明确的答案 1)为什么 Map reduce 只适用于键值对。我还读到我可以创建一个 Map reduce 作业而不实际使用 reduce 2) Mapping阶段的输入key是fileoffset key。我可以使用显式键值吗?还是自定义输入?
【问题讨论】:
-
1) 您需要了解 shuffle 和 sort 阶段的概念,才能知道为什么 key-value 有意义。 2)您可以使用任何您想要的密钥。对于读取几乎任何可拆分的文件,偏移量是完美的,因为它允许映射均匀可分割的块
-
对于您的中间问题。请阅读stackoverflow.com/questions/10630447/…