【发布时间】:2020-04-03 10:21:34
【问题描述】:
我正在运行多个使用 python/gunicorn 服务 Web 请求的 pod。有时,请求会变得非常慢(最多 60 秒),这会阻塞所有工作人员并导致 livenessProbe 失败。
在某些情况下,所有 Pod 在此状态下都被阻塞并同时重新启动(优雅关闭最多需要 60 秒)。这意味着没有可用的 pod 来接受新的请求。
有没有办法告诉 k8s 覆盖它正在重新启动的 pod?例如,当其他 pod 不健康时启动一个新 pod。
【问题讨论】:
标签: kubernetes google-kubernetes-engine