【发布时间】:2019-02-04 08:16:45
【问题描述】:
我对 flink 很陌生,即将加载我们的第一个生产版本。我们有一个数据流。有状态过滤器正在检查数据是否是新的。
-
最好将流拆分到不同的作业以更好地控制并行性,如选项 1 所示,还是选项 2 更好?
- 遵循documentation recommendation。我应该为每个操作员输入
uid,例如:
- 遵循documentation recommendation。我应该为每个操作员输入
dataStream
.uid("firstid")
.keyBy(0)
.flatMap(flatMapFunction)
.uid("mappedId)
【问题讨论】:
标签: apache-flink flink-streaming