【发布时间】:2019-07-07 03:40:32
【问题描述】:
最近,我们在非生产集群和生产集群中都遇到了节点遇到“系统 OOM 遇到”问题的问题。
非生产集群中的节点似乎没有共享 pod。似乎给定节点正在运行所有 pod 并对系统施加负载。
此外,Pod 卡在以下状态:'Waiting: ContainerCreating'。
对于上述问题的任何帮助/指导将不胜感激。我们正在这个集群中构建越来越多的服务,并希望确保没有不稳定和/或环境问题,并在我们上线之前进行适当的检查/配置。
【问题讨论】:
-
通常“kubectl describe nodes”提供了解决集群级问题的见解。如果您分享结果,也许有人可以提供帮助。
-
是的,我尝试这样做并得到以下“无法为 pod "xxx-3615518044-6l1cf_xxx-qa(8a5d9893-230b-11e8-a943-000d3a35d8f4) 安装卷”:超时已过期等待要为 pod“xxx-service-3615518044-6l1cf”/“xxx-qa”附加/挂载的卷。未附加/卸载的卷列表=[default-token-xxxx]”
-
最好编辑原始问题,添加命令和结果以获取更多上下文。