【问题标题】:What is the node status after a commit in a Galera clusterGalera 集群中提交后的节点状态是什么
【发布时间】:2015-12-04 01:49:11
【问题描述】:

如 Galera 文档所述,集群使用同步复制。但再深入一点,有一些说法,Galera 只是“实际上”同步的。在节点上,提交必须通过“认证”而不是物理提交。我真的需要了解这部分来规划应用程序的架构。

所以我现在想知道以下哪种情况是正确的:

脚本 A 在事务中执行 UPDATE 大约需要 5 秒,而 COMMIT 也需要几秒钟。当脚本 A 立即完成时,脚本 B 紧随其后,例如在一秒钟内 HTTP-POST-Request 之后的 HTTP-Redirect。脚本 B 查询与脚本 A 不同的节点。

  1. 脚本 B 获得 UPDATE 之前的状态,因为 UPDATE 仍然需要大约 4 秒才能完成。
  2. 脚本 B 获取 UPDATE 之后的状态,因为 COMMIT 在所有节点的状态同步时结束。

如果有的话,哪一个是正确的?还是行为取决于配置?

【问题讨论】:

  • 根据“为什么”更新缓慢,它的复制可能会非常快(使用基于行的复制)。
  • dba.stackexchange.com/a/54615 似乎涵盖了这一点。
  • @jkavalik 在dba.stackexchange.com/a/54615 上声明,给出过时数据的可能性很小?事实上,这篇文章在 percona faq percona.com/doc/percona-xtradb-cluster/5.5/faq.html 旁边,这是我在这里提出问题的原因。但对我来说,这似乎更像是一个编程问题,而不是一个管理问题。 5 秒有点被高估了,可能是 50 毫秒,可能是因为加入了不同的表或其他什么。重要的是,以下脚本 B 更快。但这是我第一次接触 Galera,也许我问错了问题。

标签: mysql mariadb galera


【解决方案1】:

事件顺序:

-- Node 1:
BEGIN;  (or otherwise start a transaction)
Do some writes
COMMIT;
Node 1 sends the entire transaction (via RBR) to the other nodes.
The other nodes say "OK, there won't be any conflicts".
Node 1 receives the OKs.
Node 1 responds OK to the client.
-- (eventually) on the other nodes:
Actually finish writing the data disk, etc.

请注意,到其他节点只有一次往返,并且发生在COMMIT 之后,控制权返回给客户端之前。 这就是 Galera 的秘诀。

同步,客户端只有在所有个节点都有数据并同意写入成功后才获得OK。

它是“虚拟的”,因为一些工作(通常是 I/O 密集型)尚未完成。

“关键阅读”是,例如,用户发布博客条目,然后去查看它(但可能连接到不同的从站/节点)。他希望它在那里。在常规复制中,没有干净的方法来停止SELECT,直到从站赶上。在 Galera,SET wsrep_sync_wait = 31 在执行 SELECT 之前。这将确保“虚拟”变为“真实”。

'31' 是位掩码;也许你需要更少的位。看 wsrep_sync_wait.

我希望这可以为您提供足够的信息来确定您的节点 A 和节点 B 将做什么。

如果有autocommit=ON,而没有BEGIN,则认为写入(例如UPDATE)是BEGIN; write; COMMIT;。那么我上面的列表仍然适用。

在我看来,5 秒的交易时间太长了。我会尝试找出其中最长的部分并对其进行优化。

【讨论】:

  • 谢谢,wsrep_sync_wait 选项是我搜索的,但不知道如何要求 :-) 5 秒只是一个例子,但我知道一个带有管理任务的项目,其中查询花更多的时间来更新 100,000 个条目,我猜这并不算多。
  • 在使用真实条件和重负载测试选项wsrep_sync_wait 之后,我不鼓励使用此选项。在正常情况下,它可以工作,但是在负载高峰时,galera 集群在我们的设置中崩溃了。使用单个节点进行写入和关键任务以及使用其他节点读取任务在长度上优于其他所有设置。
  • 我很困惑。您是否将批判性阅读交给了单身大师?
  • 是的,我们实现了一些旧代码,就像我们在主从设置中使用的一样,但是使用 3 个节点的 Galera 集群。使用这种设置,负载测试的速度是使用 galera 和wsrep_sync_wait 的两倍到三倍。我的猜测是,它的作用类似于与旧的 MyISAM 引擎相比的表锁定。
猜你喜欢
  • 1970-01-01
  • 2019-03-05
  • 2015-04-17
  • 2016-07-11
  • 2021-10-07
  • 2015-12-03
  • 2018-03-18
  • 2014-04-04
相关资源
最近更新 更多