【发布时间】:2021-01-21 12:05:27
【问题描述】:
我是这个论坛的新手,对 Kubernetes 也很陌生。但是,我遇到了 GKE 集群的问题 - 一个节点的状态正在切换到 NotReady 很多。在过去的两周里,它可能每天至少发生一次。最大的问题是它发生在我真正需要它工作的白天(我的网站出现故障)。当我重新启动它时,一切都会再次恢复正常,但这通常需要 20 分钟,而且我没有时间(或不会)每天都这样做。
查看节点的日志时,我可以看到当节点将其状态更改为NotReady 时,这三个消息将始终出现在其中的模式:
2020-10-06T07:58:03.782923Z curl: (28) Operation timed out after 10001 milliseconds with 0 bytes received
2020-10-06T07:58:03.782923Z Kubelet is unhealthy!
2020-10-06T07:58:21Z Node gke-cluster-default-pool-d02df301-cyfr status is now: NodeNotReady
有没有人知道我可以做些什么来解决或至少解决这个问题?
最好的问候,埃里克
【问题讨论】:
-
您好。好的,kubernetes 并不是真正的微不足道的技术。第一个问题:如果你需要它工作,为什么不从一个足够强大的虚拟机开始,或者在你掌握了切换选项的同时尝试kubernetes?错误消息通常与 wordpress 插件问题有关。你到底在运行什么工作负载,你是如何部署它的?您是否为您的工作负载配备了负载均衡器和运行状况检查?会不会是插件中的错误会触发运行状况检查变得不健康?
-
你好。要充分了解您所处的情况,请提供您遵循的步骤(指南、链接等)。请详细说明您的
GKE集群(版本、您拥有多少个节点等)。另外,还有官方文档关于故障排除GKE:cloud.google.com/kubernetes-engine/docs/troubleshooting.
标签: kubernetes google-kubernetes-engine kubelet