【问题标题】:MongoDB replica set no primary and nodes unreachableMongoDB 副本集没有主节点和无法访问的节点
【发布时间】:2020-09-22 07:19:10
【问题描述】:

我正在尝试在 mongoDB 中创建一个具有 3 个节点(主节点和 2 个辅助节点)的基本副本集。 它曾经对我有用,但突然我在 rs.status() 中看到主节点现在是辅助节点,而其他 2 个节点无法访问。我试图重新配置,启动但没有任何效果。我所做的只是删除 2 个节点并保留 1 个主节点,但是每当我尝试添加 2 个节点时,它都会给我一个错误,表明正在重新配置节点。

rs1:SECONDARY> rs.status()
{
        "set" : "rs1",
        "date" : ISODate("2020-09-22T07:11:47.370Z"),
        "myState" : 2,
        "term" : NumberLong(3),
        "syncSourceHost" : "",
        "syncSourceId" : -1,
        "heartbeatIntervalMillis" : NumberLong(2000),
        "majorityVoteCount" : 2,
        "writeMajorityCount" : 2,
        "votingMembersCount" : 3,
        "writableVotingMembersCount" : 3,
        "optimes" : {
                "lastCommittedOpTime" : {
                        "ts" : Timestamp(1600758614, 1),
                        "t" : NumberLong(3)
                },
                "lastCommittedWallTime" : ISODate("2020-09-22T07:10:14.325Z"),
                "appliedOpTime" : {
                        "ts" : Timestamp(1600758624, 1),
                        "t" : NumberLong(3)
                },
                "durableOpTime" : {
                        "ts" : Timestamp(1600758624, 1),
                        "t" : NumberLong(3)
                },
                "lastAppliedWallTime" : ISODate("2020-09-22T07:10:24.326Z"),
                "lastDurableWallTime" : ISODate("2020-09-22T07:10:24.326Z")
        },
        "lastStableRecoveryTimestamp" : Timestamp(1600758614, 1),
        "members" : [
                {
                        "_id" : 0,
                        "name" : "127.0.0.1:27011",
                        "health" : 1,
                        "state" : 2,
                        "stateStr" : "SECONDARY",
                        "uptime" : 3007,
                        "optime" : {
                                "ts" : Timestamp(1600758624, 1),
                                "t" : NumberLong(3)
                        },
                        "optimeDate" : ISODate("2020-09-22T07:10:24Z"),
                        "syncSourceHost" : "",
                        "syncSourceId" : -1,
                        "infoMessage" : "",
                        "configVersion" : 382587,
                        "configTerm" : -1,
                        "self" : true,
                        "lastHeartbeatMessage" : ""
                },
                {
                        "_id" : 1,
                        "name" : "127.0.0.1:27012",
                        "health" : 0,
                        "state" : 8,
                        "stateStr" : "(not reachable/healthy)",
                        "uptime" : 0,
                        "optime" : {
                                "ts" : Timestamp(0, 0),
                                "t" : NumberLong(-1)
                        },
                        "optimeDurable" : {
                                "ts" : Timestamp(0, 0),
                                "t" : NumberLong(-1)
                        },
                        "optimeDate" : ISODate("1970-01-01T00:00:00Z"),
                        "optimeDurableDate" : ISODate("1970-01-01T00:00:00Z"),
                        "lastHeartbeat" : ISODate("2020-09-22T07:11:42.692Z"),
                        "lastHeartbeatRecv" : ISODate("1970-01-01T00:00:00Z"),
                        "pingMs" : NumberLong(0),
                        "lastHeartbeatMessage" : "Couldn't get a connection within the time limit of 500ms",
                        "syncSourceHost" : "",
                        "syncSourceId" : -1,
                        "infoMessage" : "",
                        "configVersion" : -1,
                        "configTerm" : -1
                },
                {
                        "_id" : 2,
                        "name" : "127.0.0.1:27013",
                        "health" : 0,
                        "state" : 8,
                        "stateStr" : "(not reachable/healthy)",
                        "uptime" : 0,
                        "optime" : {
                                "ts" : Timestamp(0, 0),
                                "t" : NumberLong(-1)
                        },
                        "optimeDurable" : {
                                "ts" : Timestamp(0, 0),
                                "t" : NumberLong(-1)
                        },
                        "optimeDate" : ISODate("1970-01-01T00:00:00Z"),
                        "optimeDurableDate" : ISODate("1970-01-01T00:00:00Z"),
                        "lastHeartbeat" : ISODate("2020-09-22T07:11:42.692Z"),
                        "lastHeartbeatRecv" : ISODate("1970-01-01T00:00:00Z"),
                        "pingMs" : NumberLong(0),
                        "lastHeartbeatMessage" : "Couldn't get a connection within the time limit of 500ms",
                        "syncSourceHost" : "",
                        "syncSourceId" : -1,
                        "infoMessage" : "",
                        "configVersion" : -1,
                        "configTerm" : -1
                }
        ],
        "ok" : 1,
        "$clusterTime" : {
                "clusterTime" : Timestamp(1600758624, 1),
                "signature" : {
                        "hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
                        "keyId" : NumberLong(0)
                }
        },
        "operationTime" : Timestamp(1600758624, 1)
}

此外,当我尝试使用 3 节点成员然后 rs.initiate() 创建配置文件时,我收到错误消息“errmsg”:“已经初始化”。

【问题讨论】:

  • 你启动服务了吗?所有服务都在您的本地主机上运行,​​您是否为每个实例使用专用的dbPath
  • 我运行这些来启动服务:/usr/bin/mongod --config /home/mongodb/data1/db/mongod.cfg --port 27011 & /usr/bin/mongod --配置 /home/mongodb/data2/db/mongod.cfg --port 27012 & /usr/bin/mongod --config /home/mongodb/data3/db/mongod.cfg --port 27013 &
  • 您的mongod.cfg 文件是什么样的?
  • ``` echo "复制:replSetName: rs1" >> /home/mongodb/data1/db/mongod.cfg echo "复制:replSetName: rs1" >> /home/mongodb/data2/ db/mongod.cfg echo "复制:replSetName: rs1" >> /home/mongodb/data3/db/mongod.cfg ``
  • 请用这些细节而不是评论更新问题。

标签: mongodb replication database-replication


【解决方案1】:

如果您要设置一个副本集,您应该启动它一次,然后不要动它的配置。

如果您有意重新配置 RS,则可以更改其配置,但这不是您在当前场景中所做的。

在 3 节点 RS 中,必须至少有 2 个节点启动才能有主节点。

当你第一次遇到问题时,你应该做的是把两个宕机的节点之一打开,然后 RS 应该已经自动愈合了。

假设您实际上没有成功更改任何设置,您可能仍然可以启动故障节点,这可能会解决所有问题。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-04-01
    • 1970-01-01
    • 2019-01-21
    • 1970-01-01
    • 2022-01-19
    • 1970-01-01
    相关资源
    最近更新 更多