【发布时间】:2017-06-03 20:02:04
【问题描述】:
我在 GCP Dataflow/Apache Beam 中有一个 PCollection。我需要“按 N”组合,而不是一一处理。像grouped(N) 这样的东西。因此,在有界处理的情况下,它将分批按 10 个项目分组,最后一批将剩下的所有项目分组。
这在 Apache Beam 中可行吗?
【问题讨论】:
-
GroupIntoBatchesPTransform 在这里不适用吗?
标签: google-cloud-dataflow apache-beam