【发布时间】:2020-09-18 21:42:12
【问题描述】:
当 ambari 版本为 2.6.x 时,我们有 872 个数据节点机器的 ambari 集群
我们现在有一些网络问题,
经过长期调查,我们发现,在某些机器上运行的 ambari 代理无法与 ambari 服务器进行良好的通信
因此,我们从 ambari 仪表板中得到了一些奇怪的行为,即 5 个死数据节点,虽然数据节点机器肯定是健康的
是否有可能在 ambari 代理配置中提供更多的容忍值,以便 ambari 代理与 ambari 服务器之间的 ack 将在更短的时间后忽略网络问题?
类似 ambari 代理与 ambari 服务器之间的超时或时间连接
【问题讨论】:
-
除了您正在寻找的此设置之外,您还有其他问题。我在 Cloudera 社区看到过类似的帖子,有人特别提到了相同数量的数据节点。 872 节点需要一些非常具体的性能调整。我建议你们练习一下您的 cloudera 支持许可证,或者联系 DFHEINZ 之类的人进行集群评估、调优和高可用性。