【问题标题】:kubernetes error syncing pod - how to debugkubernetes 错误同步 pod - 如何调试
【发布时间】:2017-12-28 10:21:32
【问题描述】:

我经常在 Google Kubernetes Engine 上的 Kubernetes 集群上收到有关 pod 未同步 / ImagePullBackOff 错误的错误。但我不确定如何调试问题,因为我无法确定根本原因。

在 Google 仪表板中,我可以看到 ReplicaSet 有警告: Pod 错误:ImagePullBackOff

如果我深入到 pod,我可以在日志中看到: 消息:同步 pod 时出错 原因:同步失败

但仅此而已。为什么 Pod 会同步失败?

更新:在我看到的日志中进一步向下:

Failed to pull image "cockroachdb/cockroach:v1.1.3": rpc error: code = Unknown desc = failed to register layer: ApplyLayer exit status 1 stdout: stderr: open /usr/share/zoneinfo/right/America/Pangnirtung: no space left on device

我已经为 cockroachdb 分配了 1 GB 的持久存储空间 - 将尝试增加到 10 GB 以查看是否可以解决任何问题。还是我需要增加节点池的磁盘大小?

【问题讨论】:

  • k8s 菜鸟问题 - 你是如何得到这些日志的?

标签: kubernetes google-kubernetes-engine


【解决方案1】:

ImagePullBackOff 大部分时间发生是由于图像名称中的拼写错误或无法访问存储库:

  • 通过在 docker pull 命令中复制/粘贴图像名称来检查拼写错误(复制/粘贴,以便同时复制/粘贴任何错误:您希望找到错误而不是确认自己的偏见)。
  • 通过登录 pod 并执行 nslookup/dig 命令(或 ping opr 访问 DNS 的任何内容)来检查 DNS 的可访问性。

【讨论】:

  • 感谢诺伯特。这发生在我通过 Helm 安装的 cocroachdb 的预制 helm 图像上,所以我认为这不是名称或存储库的问题。我附上了我的日志中的错误图片。
  • 您似乎找到了第三个可能的原因:检查下载图像的磁盘。您的磁盘似乎已满。
  • 发生在我身上,原来我正在尝试拉私人图像.. derp。
猜你喜欢
  • 2016-09-20
  • 2016-12-06
  • 2021-07-24
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-04-24
  • 2020-12-07
  • 1970-01-01
相关资源
最近更新 更多