【问题标题】:memsql aggregator fail - how to recover the clustermemsql 聚合器失败 - 如何恢复集群
【发布时间】:2016-10-15 21:02:15
【问题描述】:

我有一个带有 4 个子聚合器、30 个叶子和一个失败的主聚合器的 memsql 集群。在这一点上,无论我要做什么,我都无法恢复主人。那个实例消失了。我已将其中一个子聚合器提升为大师。

一旦我连接到 memsql 并运行 show databases;鞋叶/聚合器...一切就绪。但是,我如何设法将这个孩子变成大师?我的意思是,在 Web UI 上,master 似乎正在运行一个零叶子的新启动集群。我也看不到在提升的子聚合器上创建的任何主文件夹。

所以我的问题是我从这里去哪里?例如,如果我想重新启动整个集群,考虑到从子提升节点我得到 memsql-ops memsql-list 的事实,我将如何做 没有找到 MemSQL 节点?

我将如何执行典型操作 - 更新、重启?

【问题讨论】:

  • 那么,连接到您提升的聚合器并运行 SHOW AGGREGATORs 和 SHOW LEAVES 会显示集群中的所有叶子和聚合器,但是 memsql-ops 仪表板没有正确显示此信息?
  • 没错。显示一个空列表。
  • 同:memsql-ops memsql-list >> 没有找到 MemSQL 节点

标签: singlestore


【解决方案1】:

听起来您已成功将子聚合器提升为 MemSQL 集群中的主聚合器,但 MemSQL Ops 丢失了所有集群信息,因为 Ops 主代理(默认情况下与主聚合器位于同一主机上)消失了.

我不确定您的情况 - 您是否提升了新的 Ops 主要代理? - 但一般来说,如果您在集群的所有节点上有一个正常运行的 MemSQL 集群和 MemSQL Ops,但 Ops 没有监控 MemSQL(即 memsql-ops memsql-list 为空),您将运行 memsql-ops memsql-monitor为每个 MemSQL 节点添加到 Ops 监控中。

编辑:答案是您还没有提升新的 Ops 主要代理。在这种情况下,您需要执行以下操作。

  • 在除旧主节点之外的每个节点上运行 memsql-ops unfollow
  • 选择一个节点作为新的主节点 - 例如新的主聚合器。
  • 在除新主节点之外的每个节点上运行 memsql-ops follow -h NEW_PRIMARY_HOSTNAME
  • 运行 memsql-ops monitor -h NEW_MASTER_AGGREGATOR

【讨论】:

  • memsql-ops memsql-monitor >> 无法访问主代理。验证主代理是否在线且可访问,或运行 memsql-ops unfollow --force 以从拓扑中删除此代理。
  • 这片叶子我认为它仍然跟随前主人作为主要代理人(?)
  • 好的,所以我猜你没有推广新的主要代理。您在哪个节点上查看 Ops Web ui?还是原来的 Master Aggregator 节点吗?我将在上面添加说明以推广新的 Ops 主节点,以便更好地格式化。
  • 不,原来的主聚合器节点是一个故障的 AWS 实例,已被终止。我在看新的主人(前儿童聚合器)。由于那个被提升为新的主人,我假设整个旧主人的功能都将被发送给新主人。
  • 有两个独立的“master”概念——MemSQL 集群本身有 Master Aggregator,另外 MemSQL Ops 有一个 Primary Agent。您似乎通过提升子聚合器转移了前者,而不是后者。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2011-01-27
  • 2013-03-23
  • 1970-01-01
  • 2016-08-16
  • 2019-03-18
  • 2022-12-08
  • 1970-01-01
相关资源
最近更新 更多