定义
Apache Flink 是一个分布式流式计算引擎,用于在数据流上进行有状态的计算(Flink系列:无界和有界数据流定义与区别)。
特性
低延迟
有状态的 Flink 程序针对本地状态访问进行了优化。任务的状态始终保留在内存中,如果状态大小超过可用内存,则会保存在能高效访问的磁盘数据结构中。任务通过访问本地(通常在内存中)状态来进行所有的计算,从而产生非常低的处理延迟。
故障恢复
定期异步地对本地状态进行持久化存储来保证故障场景下精确一次的状态一致性。
Apache Flink 是一个分布式流式计算引擎,用于在数据流上进行有状态的计算(Flink系列:无界和有界数据流定义与区别)。
低延迟
有状态的 Flink 程序针对本地状态访问进行了优化。任务的状态始终保留在内存中,如果状态大小超过可用内存,则会保存在能高效访问的磁盘数据结构中。任务通过访问本地(通常在内存中)状态来进行所有的计算,从而产生非常低的处理延迟。
故障恢复
定期异步地对本地状态进行持久化存储来保证故障场景下精确一次的状态一致性。
相关文章: