【发布时间】:2017-07-22 01:01:21
【问题描述】:
是否可以从 Flink 流式作业触发检查点?
我的用例是:我有两个流 R 和 S 加入翻滚时间窗口。来源是卡夫卡。我使用事件时间处理和 BoundedOutOfOrdernessGenerator 来确保来自两个流的事件最终在同一个窗口中。
问题是我的状态很大,有时定期检查点会花费太多时间。起初,我想禁用检查点并依赖 Kafka 偏移量。但是无序意味着我已经在未来的窗口中从当前偏移量中获得了一些数据。所以我需要检查点。
如果可以在清理窗口而不是定期清理窗口后触发检查点,那么效率会更高。也许在 evictAfter 方法中。
这有意义吗?有可能吗?如果不是,我将不胜感激。
【问题讨论】:
-
在 Flink 环境中可以尝试减少检查点间隔。您看过 1.2 发行说明吗? ci.apache.org/projects/flink/flink-docs-release-1.2/dev/stream/…
-
我看不出这有什么帮助。即使我不那么频繁地进行检查,它们仍然会很大。为了提高效率,我想在运算符中的事件数量最少时触发检查点。
-
更多。减少间隔会使检查点更小
标签: apache-flink flink-streaming