kubernetes 错误同步 pod - 如何调试答案

【问题标题】：kubernetes error syncing pod - how to debugkubernetes 错误同步 pod - 如何调试
【发布时间】：2017-12-28 10:21:32
【问题描述】：

我经常在 Google Kubernetes Engine 上的 Kubernetes 集群上收到有关 pod 未同步 / ImagePullBackOff 错误的错误。但我不确定如何调试问题，因为我无法确定根本原因。

在 Google 仪表板中，我可以看到 ReplicaSet 有警告： Pod 错误：ImagePullBackOff

如果我深入到 pod，我可以在日志中看到：消息：同步 pod 时出错原因：同步失败

但仅此而已。为什么 Pod 会同步失败？

更新：在我看到的日志中进一步向下：

Failed to pull image "cockroachdb/cockroach:v1.1.3": rpc error: code = Unknown desc = failed to register layer: ApplyLayer exit status 1 stdout: stderr: open /usr/share/zoneinfo/right/America/Pangnirtung: no space left on device

我已经为 cockroachdb 分配了 1 GB 的持久存储空间 - 将尝试增加到 10 GB 以查看是否可以解决任何问题。还是我需要增加节点池的磁盘大小？

【问题讨论】：

k8s 菜鸟问题 - 你是如何得到这些日志的？

标签： kubernetes google-kubernetes-engine

【解决方案1】：

ImagePullBackOff 大部分时间发生是由于图像名称中的拼写错误或无法访问存储库：

通过在 docker pull 命令中复制/粘贴图像名称来检查拼写错误（复制/粘贴，以便同时复制/粘贴任何错误：您希望找到错误而不是确认自己的偏见）。
通过登录 pod 并执行 nslookup/dig 命令（或 ping opr 访问 DNS 的任何内容）来检查 DNS 的可访问性。

【讨论】：

感谢诺伯特。这发生在我通过 Helm 安装的 cocroachdb 的预制 helm 图像上，所以我认为这不是名称或存储库的问题。我附上了我的日志中的错误图片。
您似乎找到了第三个可能的原因：检查下载图像的磁盘。您的磁盘似乎已满。
发生在我身上，原来我正在尝试拉私人图像.. derp。