【问题标题】:Can't start second node in MySQL Galera cluster无法启动 MySQL Galera 集群中的第二个节点
【发布时间】:2013-12-02 14:17:29
【问题描述】:

所有操作都在 debian 7 虚拟机中执行。已安装两个节点:galera 复制器、来自 codership 的 mysql galera、percona-xtrabackup、netcat-openbsd(由 percona-xtrabackup 要求)。第三个节点只有 galera 复制器,作为仲裁器运行 garbd。

在节点 #1 (192.168.0.102) 上配置

wsrep_provider=/usr/lib/galera/libgalera_smm.so
wsrep_provider_options="gcache.size=2G"
wsrep_cluster_name="clusterTest"
wsrep_cluster_address="gcomm://"
wsrep_node_name="node-1"
wsrep_node_address=192.168.0.102
wsrep_node_incoming_address=192.168.0.102
wsrep_slave_threads=16
wsrep_sst_method=xtrabackup
wsrep_sst_receive_address=192.168.0.102
wsrep_sst_auth=root:somepass

在节点 #2 (192.168.0.103) 上配置

wsrep_provider=/usr/lib/galera/libgalera_smm.so
wsrep_provider_options="gcache.size=2G"
wsrep_cluster_name="clusterTest"
wsrep_cluster_address="gcomm://192.168.0.102"
wsrep_node_name="node-2"
wsrep_node_address=192.168.0.103
wsrep_node_incoming_address=192.168.0.103
wsrep_slave_threads=16
wsrep_sst_method=xtrabackup
wsrep_sst_receive_address=192.168.0.103
wsrep_sst_auth=root:somepass
wsrep_sst_donor="node-1"

第一次运行时只有 node-1 有一个用于测试的数据库,我们称之为 testDB。

我做什么:

1. node-1> service mysql start
Result: node is working, testDB is accessible from any host and the node itself.
2. node-3> garbd --address gcomm://192.168.0.102,192.168.0.103 --group "clusterTest"
Resutl: the cluster size is 2.
3. node-2> service mysql start
Result: the cluster size is 3, but the init-script reports that service start failed, however the processes are running, the sst is performed.

我也无法访问在 node-2 上运行的 mysql:

ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/var/run/mysqld/mysqld.sock' (111)

从远程主机:

PHP Warning:  mysqli::mysqli(): (HY000/2003): Can't connect to MySQL server on '192.168.0.103' (111)

来自节点 1 的集群状态:

wsrep_local_state_comment    | Donor/Desynced
wsrep_incoming_addresses     | 192.168.0.102:3306,,192.168.0.103:3306
wsrep_cluster_conf_id        | 3                                     
wsrep_cluster_size           | 3   

如果我在 wsrep_provider 设置为“none”的情况下在 node-2 上启动 mysql,则该数据库可以从本地和远程主机完全访问,并且等于 node-1 上的数据库。如果我再次启动集群,情况会重复,node-2 仅对其他节点可见,集群变得不同步,并且 node-2 既不能从控制台访问,也不能从远程主机访问。

【问题讨论】:

  • 与 MariaDB Galera Cluster 的情况完全相同。使用 Percona XtraDB Cluster,一切都按预期工作,无需更改配置。非 Percona MySQL 服务器的任何其他设置?

标签: mysql replication galera


【解决方案1】:

在解决 Galera 问题时最有用的工具是 MySQL 错误日志。在 Debian 中,它们默认位于 /var/log/syslog 中。

您似乎正在使用节点 1 来引导您的集群。正确设置 wsrep_cluster_address 至关重要。两个节点的设置应该如下:

Node 1

wsrep_cluster_address=gcomm://


Node 2

wsrep_cluster_address=gcomm://192.168.0.102,192.168.0.103

【讨论】:

  • 你确定吗?我认为wsrep_cluster_address 在整个集群中应该是相同的......
  • 考虑到这是一个已有 8 年历史的答案,是的。引导要求 wsrep_cluster_address 参数为空。当时的大多数 sysv 脚本都没有引导选项。清空wsrep_cluster_address 是最好的答案。我敢肯定 galera 从那时起已经进化了。
猜你喜欢
  • 2018-10-14
  • 2015-04-17
  • 1970-01-01
  • 1970-01-01
  • 2018-11-04
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2016-07-11
相关资源
最近更新 更多