【发布时间】:2017-02-22 05:29:06
【问题描述】:
我想知道在 Flink 中是否可以在算子之间共享状态。
例如,假设我在一个运算符上通过键进行分区,我需要分区 A 内的一个分区状态 C(出于任何原因)(图 1.a),或者我需要下游运营商F 中运营商C 的状态(图1.b)。
我知道可以broadcast 记录到所有分区。因此,如果您在记录中包含操作员的内部状态,您可以与下游操作员共享您的内部状态。
但是,这可能是一项昂贵的操作,而不是简单地让op1 专门要求op2 状态。
最近围绕可查询状态的发展是否朝着这个概念发展,或者它们只是为了让外部用户查询拓扑的内部状态?
提前感谢您的见解
【问题讨论】:
标签: apache-flink dataflow stream-processing