【发布时间】:2019-03-19 18:22:02
【问题描述】:
在阅读了 flink 的文档并四处搜索之后,我无法完全理解 flink 是如何在其窗口中处理状态的。 假设我有一个每小时翻滚的窗口,它带有一个聚合函数,可以将 msgs 累积到一些 java pojo 或 scala 案例类中。 该窗口的大小将与在一小时内进入该窗口的事件数量相关联,还是仅与 pojo/case 类相关联,因为我将事件累积到该对象中。 (例如,如果将 10000 msgs 计算为整数,大小会接近 10000 * msg size 还是 int 的大小?) 此外,如果我使用 pojos 或案例类,flink 是否为我处理状态(如果内存耗尽/在检查点保存状态等溢出到磁盘)还是我必须为此使用 flink 的状态对象?
感谢您的帮助!
【问题讨论】:
标签: apache-flink stream-processing