【问题标题】:How to and what components manually should be troubleshooted in Kubernetes using shell script如何使用 shell 脚本在 Kubernetes 中手动对哪些组件进行故障排除
【发布时间】:2020-03-11 19:50:07
【问题描述】:

我正在尝试编写 bash 脚本来解决 kubernetes cluster 问题

我有一个kubernetes cluster,一个master node,几个minions

我正在尝试编写一个脚本来对集群进行故障排除,该脚本最终输出包含错误(如果存在)和成功的详细报告

Q.) 我真正需要知道的是,我应该遵循哪些步骤以及在故障排除期间我应该测试/检查哪些组件。我需要一份关于如何解决Kubernetes Clustermanually

的程序、步骤列表

PS:我不想使用kubernetes内置的测试机制,我需要手动测试/排错。

这里有人可以给我一个很好的描述机制/步骤吗?

【问题讨论】:

  • 请描述错误的深度! Kubernetes 中的错误可能数不胜数,仅将其称为 errors 就很难理解!
  • 对 kubernetes 集群进行故障排除。如果要对整个集群进行故障排除,应该采取哪些步骤,从哪里开始等等?
  • kubernetes 有许多可移动的组件网络、存储等。您需要指定要解决的问题!
  • 每个组件。我应该从哪里开始?想象一下,这就像我们在笔记本电脑中进行的内置故障排除。我们永远不知道里面到底发生了什么,但它总是给出一个错误或成功,说 WiFi 故障排除已完成,这是结果。同样,我需要对整个集群进行故障排除,需要了解我应该从哪里开始测试我应该从哪里开始到组件/区域

标签: kubernetes kubectl minikube


【解决方案1】:

您需要检查 master 上的以下服务以确认 kubernetes 运行正常

  1. docker 应该正在运行

  2. kubelet 应该正在运行(如果您在容器中运行控制平面组件)

  3. etcd

  4. kubernetes 调度程序

  5. kubernetes 控制器管理器

  6. kubernetes 组件运行状况 (kubectl get cs)

  7. kube-system 中的所有服务都应该正在运行 (kubectl get pods -n kube-system)

【讨论】:

  • 终于有人回答了。谢谢你,先生。您还有什么要补充的吗?
  • 如果您能详细说明每个点以便清楚地说明会更好吗?
猜你喜欢
  • 2014-07-09
  • 2015-12-14
  • 2015-10-20
  • 2023-04-07
  • 1970-01-01
  • 1970-01-01
  • 2019-11-13
  • 1970-01-01
  • 2011-02-07
相关资源
最近更新 更多