【发布时间】:2018-02-01 11:37:27
【问题描述】:
我需要知道 Apache Flink 如何从检查点恢复其状态,因为在运行纯作业与从保存点恢复时,我看不出启动时间和在操作员中看到第一个事件之间有什么区别。
状态是否从检查点/保存点延迟加载?
【问题讨论】:
-
您能否详细说明一下您的用例?通常,状态会在作业开始时以保存点加载。
-
@DawidWysakowicz 是在启动时从保存点加载所有状态还是根据需要加载它们(延迟加载)?
-
正如@alpinegizmo 所说,这取决于选择的状态后端。 RocksDB 始终以字节为单位保持状态,并在访问时进行序列化/反序列化。 HeapStateBackend 在作业开始时反序列化。
-
@DawidWysakowicz 文件系统呢?
标签: apache-flink stream-processing