【发布时间】:2017-03-28 04:15:04
【问题描述】:
我正在尝试针对特定问题实施 MapReduce 算法。假设在我的 Mapper 中我需要处理一个大尺寸的文本对象。我的问题总结在下面的例子中。我有文本对象:Today is a lovely day,我需要对单词进行一些处理。所以我有两个选择:
-
我可以发送到Reducer 键值对的形式:
<1,Today> <1,is> <1,a> <1,lovely> <1,day> 我可以将键值对
<1,Today is a lovely day>发送到reducer,然后对其进行处理,例如标记字符串对象。
这种情况的最佳方法是什么?在第一种情况下,我必须向减速器发送更多数据,但我没有字符串对象来标记,就像在第二种情况下一样。但是在第二种情况下,我的 Mapper 发送的数据量较少。
【问题讨论】: