【问题标题】:Fault tolerant software architecture容错软件架构
【发布时间】:2009-03-04 11:55:36
【问题描述】:

我正在寻找一些关于容错软件架构的好文章。请给我一些建议。

【问题讨论】:

  • 太模糊了!你的目标是什么?你想建立什么?你会用什么来建造它?它是给谁的?名单还在继续……
  • 我不接受这个含糊不清的问题,但我承认它是笼统的!这就是重点。有些原则超越了特定的目标、构建、工具、客户等。
  • Jeff 提出了一个很好的观点,即说明您的目标是什么。这可能会使答案更有用。

标签: architecture fault-tolerance


【解决方案1】:

Handbook of Software Reliability Engineering你可以阅读pdf。软件可靠性的主要原则之一是容错。

看看chapter 14 Fault-Tolerant software

【讨论】:

    【解决方案2】:

    我发现'Release It!' 非常适合阅读。

    在 Release It! 中,Michael T. Nygard 向您展示了如何针对将面临的严酷现实设计和构建您的应用程序。您将学习如何设计您的应用程序,以实现最长的正常运行时间、性能和投资回报。

    【讨论】:

      【解决方案3】:

      链接转储! :)

      这些是我在研究冗余的某个方面时获得的一些想法(或仅用于术语检查)的一些在线内容。

      ACM 需要会员资格。

      【讨论】:

        【解决方案4】:

        很难在一篇文章中总结出来,因为有多种方法可以在软件中实现容错。这些原则涉及桌面、服务器应用程序和/或 SOA。还有多种方法,我们已经在不知道的情况下遵循了其中的一些方法;例如异常处理。尝试在一篇文章中深入研究所有概念将是一项艰巨的壮举。在 google 上简单搜索一下就可以找到很多文章。

        在我的五年计划中,我研究了操作系统范围的自我修复系统。我关注了 Sun Solaris 10 架构和 IBM 的自主计算研究 (http://www.research.ibm.com/autonomic/)。

        【讨论】:

          【解决方案5】:

          这篇关于Software Fault Handling techniques的文章涵盖以下主题:

          • 超时
          • 审核
          • 异常处理
          • 任务回滚
          • 增量重启
          • 投票

          【讨论】: