【发布时间】:2011-09-22 14:38:35
【问题描述】:
我的映射器发出 'uniq key' - '非常大的值' 对。
我的减速器不知道密钥是唯一的。 因此,reducer 会一直等待,直到所有映射器都完成。
我尝试使用组合器,但这对我来说不是一个简单的解决方案,因为我的减速器非常复杂。
我的问题是如何在每张地图之后执行减速器?不使用组合器。
【问题讨论】:
标签: hadoop mapreduce reducers combiners
我的映射器发出 'uniq key' - '非常大的值' 对。
我的减速器不知道密钥是唯一的。 因此,reducer 会一直等待,直到所有映射器都完成。
我尝试使用组合器,但这对我来说不是一个简单的解决方案,因为我的减速器非常复杂。
我的问题是如何在每张地图之后执行减速器?不使用组合器。
【问题讨论】:
标签: hadoop mapreduce reducers combiners
如果您的密钥是唯一的,则无需减少它们。因此,只需将减速器代码复制粘贴到映射器并将减速器编号设置为零。顺便说一句,有许多 map reduce 作业不需要 reduce 步骤,所以这并不奇怪。
【讨论】:
如果您事先知道您的密钥是唯一的,那么您可以将所有代码从 reducer 步骤移到 map 中并进行所有工作。
【讨论】:
我不明白你的问题。您可以简单地不在 Job 配置中指定组合器。
【讨论】: