【发布时间】:2016-07-13 14:36:24
【问题描述】:
以下是我的一些疑问:
我有两个不同的流stream1 和stream2,其中的元素是按顺序排列的。
1) 现在,当我对这些流中的每一个执行keyBy 时,会保持顺序吗? (因为这里的每个组都只会发送给一个任务管理器)
我的理解是,记录将是为了一组,在这里纠正我。
2) 在两个流上的keyBy 之后,我正在共同组以获取匹配和不匹配的记录。订单也会在这里维护吗?因为这也适用于KeyedStream。
我正在使用EventTime 和AscendingTimestampExtractor 生成timestamp 和watermark。
3) 现在我想使用 map/flatmap 对从 2) 得到的 matching_nonMatchingStream 执行序列检查。
我是否需要在此处再次执行keyBy,或者如果我保持链接,matching_nonMatchingStream 是否会在相同的TaskManager 中运行?
我在这里的理解是,链条将在这里工作,纠正我,感到困惑。
4) slotSharingGroup - 你能详细描述一下吗
根据文档:设置此操作的插槽共享组。如果可能,同一槽共享组中的并行操作实例将位于同一TaskManager 槽中。
【问题讨论】:
标签: apache-flink flink-streaming