【发布时间】:2020-05-15 15:11:06
【问题描述】:
我试图了解在提交 Flink 作业之前需要考虑哪些重要功能。
我的问题是并行数是多少,是否有上限(物理上)?并行性如何影响我的工作性能?
例如,我有一个 CEP Flink 作业,它从非键控流中检测模式,并行数将始终为 1,除非我使用 KeyBy 运算符对数据流进行分区。
如果我错了,请纠正我:
如果我对数据流进行分区,那么我的并行数将等于不同键的数量。但问题是模式匹配是针对每个键独立完成的,因此我无法定义需要来自具有不同键的 2 个分区的信息的模式。
【问题讨论】:
标签: apache-flink flink-streaming flink-cep flink-sql flink-batch