覆盖不健康的豆荚答案

【问题标题】：Cover for unhealthy pods覆盖不健康的豆荚
【发布时间】：2020-04-03 10:21:34
【问题描述】：

我正在运行多个使用 python/gunicorn 服务 Web 请求的 pod。有时，请求会变得非常慢（最多 60 秒），这会阻塞所有工作人员并导致 livenessProbe 失败。

在某些情况下，所有 Pod 在此状态下都被阻塞并同时重新启动（优雅关闭最多需要 60 秒）。这意味着没有可用的 pod 来接受新的请求。

有没有办法告诉 k8s 覆盖它正在重新启动的 pod？例如，当其他 pod 不健康时启动一个新 pod。

【问题讨论】：

【解决方案1】：

你可以在 L7 层有一个入口或负载均衡器，它可以将流量路由到 kubernetes 服务，该服务可以有多个后端 pod（由 pod 的标签和服务的标签选择器选择）分布在不同的部署中运行在不同的节点。入口控制器或负载均衡器可以对后端进行健康检查，并停止将流量路由到不健康的 pod。这种拓扑总体上提高了应用程序的可用性和弹性。

【讨论】：