【问题标题】:intermittently cassandra node is down for few secondscassandra 节点间歇性关闭了几秒钟
【发布时间】:2016-12-23 05:03:35
【问题描述】:

我经常看到这种行为,在 gossip 阶段,一个节点无法被发现并提示警告“INET IPADDR 现在已关闭”,但几秒钟后它会出现。当我检查节点时,它实际上并没有关闭,但无法通过其他节点发现。由于这个问题,提示非常高。

此错误的可能原因是什么?如何缓解?

【问题讨论】:

  • 您是否在云(AWS、Digital Ocean、GCE)上运行?在此 DOWN 期间,您是否在日志中看到没有响应的节点上的 GC 消息?

标签: cassandra


【解决方案1】:

可能有几个因素使节点看起来已关闭。节点由gossip protocol 确定是UP 还是DOWN。在某些环境中,gossip 可能会由于网络拥塞或长时间的 GC 事件而失败。检查DOWN节点上的system.log。这将显示所有 GC 事件及其持续时间。

增加cassandra.yaml 中的phi_convict_threshold 值会降低故障检测器的灵敏度。请注意,此值不应设置为 12 以上。

有关更多信息,请查看failure detection and recovery 文档。

【讨论】:

  • 我明白了,GC 事件。我可以采取哪些措施来调整 GC?因为提示不会降为零。
  • 您使用的是什么版本的 Java 和 Cassandra?
  • JDK1.8 和 Cassandra2.2.5
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2022-10-06
  • 2019-09-15
  • 1970-01-01
  • 1970-01-01
  • 2016-05-15
  • 2017-05-28
相关资源
最近更新 更多