【问题标题】:Does Flink support map side aggregations? (batch)Flink 是否支持 map 端聚合? (批)
【发布时间】:2018-07-16 16:22:23
【问题描述】:

Spark 具有 map-side combine 的概念,因此您可以执行部分​​聚合,从而减少(双关语意外)洗牌。

在 Flink 中有没有等价的东西?

【问题讨论】:

    标签: apache-flink


    【解决方案1】:

    是的。 Flink 提供了多个接口来定义(map-side)组合器。

    • GroupCombineFunction<IN, OUT> 将一组输入类型 IN 的子集组合成一个或多个 OUT 类型的组合值
    • CombineFunction<IN, OUT> 将一组输入类型IN 的子集组合成一个OUT 类型的值
    • ReduceFunction<T>T 类型对组合成 T 类型的单个值。该函数自动用于合并(预聚合)和归约(完全聚合)。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2013-10-03
      • 1970-01-01
      • 1970-01-01
      • 2017-10-19
      • 1970-01-01
      • 1970-01-01
      • 2021-10-26
      • 1970-01-01
      相关资源
      最近更新 更多