【问题标题】:Hadoop combiners with aggregator functions具有聚合器功能的 Hadoop 组合器
【发布时间】:2013-05-09 05:41:08
【问题描述】:

当使用聚合器函数之一代替减速器时,Hadoop 是否足够聪明以在 combiner 阶段使用相同的函数?

【问题讨论】:

  • 你必须直接指定你的组合器。所以如果你必须设置它,有什么值得聪明的呢?我一定是错过了什么
  • 聪明我的意思是,如果我跳过-combiner 属性,它会根据聚合函数执行组合阶段吗?还是我需要像-combiner aggregate -reducer aggregate一样指定它?
  • 你说的是级联聚合器吗?
  • 我想弄清楚-combiner aggregate -reducer aggregate 是否与-reducer aggregate 相同,因为也许Hadoop 足够聪明,可以优化这样的案例?

标签: hadoop aggregate reducers combiners


【解决方案1】:

它们实现了部分相同的目的,但聚合器更通用,可以在组合器不能使用的情况下使用。

所以这是肯定的,聚合器不会自动用作组合器。如果您希望将其用作组合器,则必须这样指定它。

来自级联的引用,“Combiners are limited to Associative and Commutative functions only, like 'sum' and 'max'. And in order to work, values emitted from the Map task must be serialized, sorted (deserialized and compared), deserialized again and operated on

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2015-11-09
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多