【问题标题】:pacemaker corosync service ignored起搏器 corosync 服务被忽略
【发布时间】:2017-09-29 02:29:36
【问题描述】:

两个Node集群Node A,Node B。

服务 X 在节点 A 上运行,节点 B 是 DC。

我们在 Pacemaker 中使用堆栈 corosync。 失败超时为 10 秒。 目标角色已启动。

事件是这样发生的 节点 A 向节点 B 发送事件 服务 X 已关闭 节点 B 打印 Ignoring expired failure for Service X 在此之后,集群永远不会重新启动 Service X。

现在的问题是:

  1. 为什么节点 B (DC) 会忽略过期故障?
  2. 即使此时 DC 被忽略,但服务 X 已关闭,节点 A 应监控服务并再次向节点 B 发送故障状态,此时节点 B 应重新启动服务。为什么这没有发生?

【问题讨论】:

    标签: cluster-computing pacemaker


    【解决方案1】:

    造成这种情况的一个原因可能是两台服务器(DC 和其他机器)之间的时间差。

    因此,DC 认为此事件已过时并忽略它。请同步时间,然后尝试重新创建问题。

    【讨论】:

      【解决方案2】:

      您可以将以下属性添加到您的 crm 配置中,该属性将尝试启动失败、过期的资源。

       start-failure-is-fatal="false"
      

      【讨论】:

        猜你喜欢
        • 2023-03-18
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2017-09-07
        • 2011-07-09
        • 1970-01-01
        相关资源
        最近更新 更多