【问题标题】:GKE - Auto repairing after adding a new nodepoolGKE - 添加新节点池后自动修复
【发布时间】:2021-09-18 06:46:50
【问题描述】:

GKE 在添加新节点池后自动修复。节点池大小为 1。机器类型为 n1-standard-64。它处于修复状态将近 30 分钟。在修复完成之前,不能执行其他集群操作。

如果你们中的任何人遇到类似问题并解决了它,请帮助我。

【问题讨论】:

  • 您还有多少其他节点池?这是区域集群还是区域集群? kubectl get nodes 的输出是什么?
  • 1.我总共有 7 个节点池,但是在从第二个节点池添加每个节点池时遇到了类似的问题。 2. 区域性集群。 3. kubectl get nodes - 显示之前添加的节点。

标签: google-cloud-platform google-kubernetes-engine


【解决方案1】:

GKE 开始自动修复节点的原因是检测到您的节点在给定的时间阈值内处于不健康状态。 不健康状态可能意味着:

  • 节点在对给定的连续检查时报告 NotReady 状态 时间阈值(大约 10 分钟)。
  • 节点在给定时间内完全不报告任何状态 阈值(大约 10 分钟)。
  • 节点的引导磁盘在很长一段时间内磁盘空间不足 (大约 30 分钟)。

如果 GKE 检测到某个节点需要修复,则该节点将被清空并重新创建。 GKE 等待 1 小时完成排空。如果排空未完成,则关闭节点并创建新节点。

您可以随时查看修复节点的日志,找出根本原因。

您可以随时禁用自动修复,方法是在云 shell 中运行此行或查看控制台说明 here

gcloud container node-pools update pool-name --cluster cluster-name
--zone 计算区域
--no-enable-autorepair

【讨论】:

    猜你喜欢
    • 2021-06-20
    • 1970-01-01
    • 2021-04-19
    • 1970-01-01
    • 2021-06-23
    • 2023-02-15
    • 2022-01-04
    • 2015-05-22
    • 2022-01-15
    相关资源
    最近更新 更多