【发布时间】:2018-06-27 19:41:22
【问题描述】:
我们正在使用 Apache Flink(1.4.2) 进行批处理,出于性能原因而不是直接输出每个项目,我们希望在输出之前对 100 个项目进行分组。
如果我们要使用 DataStream API,我们将能够使用像翻滚窗口这样的东西 (https://ci.apache.org/projects/flink/flink-docs-release-1.5/dev/stream/operators/windows.html#tumbling-windows)
但这在做批处理时不可用。
是否有可能使用 DataSet Api 通过一些 group / reduce 函数来做到这一点?
【问题讨论】:
-
应该可以。试试看。
标签: batch-processing apache-flink