【问题标题】:Hadoop mapper emits a unique key. Can I perform reducer after per map?Hadoop 映射器发出一个唯一键。我可以在每张地图之后执行减速器吗?
【发布时间】:2011-09-22 14:38:35
【问题描述】:

我的映射器发出 'uniq key' - '非常大的值' 对。

我的减速器不知道密钥是唯一的。 因此,reducer 会一直等待,直到所有映射器都完成。

我尝试使用组合器,但这对我来说不是一个简单的解决方案,因为我的减速器非常复杂。

我的问题是如何在每张地图之后执行减速器?不使用组合器。

【问题讨论】:

    标签: hadoop mapreduce reducers combiners


    【解决方案1】:

    如果您的密钥是唯一的,则无需减少它们。因此,只需将减速器代码复制粘贴到映射器并将减速器编号设置为零。顺便说一句,有许多 map reduce 作业不需要 reduce 步骤,所以这并不奇怪。

    【讨论】:

      【解决方案2】:

      如果您事先知道您的密钥是唯一的,那么您可以将所有代码从 reducer 步骤移到 map 中并进行所有工作。

      【讨论】:

        【解决方案3】:

        我不明白你的问题。您可以简单地不在 Job 配置中指定组合器。

        【讨论】:

          猜你喜欢
          • 1970-01-01
          • 2014-01-17
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          相关资源
          最近更新 更多