【发布时间】:2016-01-13 21:56:47
【问题描述】:
当我以 QUORUM=2 运行 3 个 mesos-master 时,它们在被选为领导者后 1 分钟失败,出现错误:
E1015 11:50:35.539562 19150 socket.hpp:174] Shutdown failed on fd=25: Transport endpoint is not connected [107]
E1015 11:50:35.539897 19150 socket.hpp:174] Shutdown failed on fd=24: Transport endpoint is not connected [107]
他们不断在循环中相互选举,不断失败并重新选举。
如果我设置 QUORUM=1,一切正常。这可能是什么原因?
【问题讨论】:
-
你是给mesos邮件列表发邮件的吗?已经解决了吗?
-
是的,就是我。一个问题是防火墙阻止了访问服务器的公共 IP,而 zookeeper 正在广播公共 IP(在 Advertisement_ip 中设置),因此没有人能够相互连接。从站也无法连接到主站,出现同样的错误。当我删除防火墙规则并将本地IP设置为advertise_ip时,从属可以连接。但尚未尝试 QUORUM=2。
-
听起来不错,如果您最终能解决问题或遇到新问题,也请发送到邮件列表。以便其他人也可以从您的案例中学习。谢谢你。 :-)
-
很高兴听到 :) 我肯定会在邮件列表中发布更新。希望我能找到一些解决方案。谢谢!
-
我也有同样的问题。这不是一个好主意,但是当我在
/etc/hosts中添加其他节点的 IP 时,一切正常。
标签: apache-zookeeper mesos mesosphere