【发布时间】:2021-07-16 18:05:42
【问题描述】:
Cadence 是一个容错的有状态代码平台。 cadence如何处理各种故障情况下的故障?
【问题讨论】:
标签: cadence-workflow
Cadence 是一个容错的有状态代码平台。 cadence如何处理各种故障情况下的故障?
【问题讨论】:
标签: cadence-workflow
分布式系统中存在各种各样的故障,Cadence 为它们提供了各种选项。
这是我自己的清单。它可能不完整。但如果我能想到,我会尝试添加更多。
通过事件溯源模型的设计,工作流可以从工作人员崩溃的任何时间点恢复。见https://cadenceworkflow.io/docs/concepts/workflows/#state-recovery-and-determinism
工作流还可以有重试策略,例如在失败时自动重试的活动https://cadenceworkflow.io/docs/concepts/workflows/#workflow-retries
在某些情况下,失败是由导致错误状态的错误代码更改引起的。 Cadence 提供“重置”工具来将工作流程重置到任何时间点。 见https://cadenceworkflow.io/docs/cli/#reset-and-restart
除了重置之外,Cadence 还允许您通过部署进行重置。这对于重置大量工作流(例如数百万个)很有用。
活动和工作流工作者都是无状态的。
Cadence 服务器是一种高度可用且可扩展的服务,提供了持久性。
【讨论】: