【发布时间】:2021-10-31 02:09:51
【问题描述】:
我在 GKE 自动驾驶仪上运行 Kubernetes 集群
我的 Pod 执行以下操作 - 等待作业,运行作业(这可能需要几分钟或几小时),然后进入 Pod Succeeded 状态,这将导致 Kubernetes 重新启动 Pod。
我需要的 pod 数量取决于平台上的用户数量。每个用户都可以请求一个需要 pod 才能运行的作业。
我不希望用户必须等待 pod 扩大规模,因此我希望保留一些额外的 pod 准备就绪并等待执行。
我的 pod 正在运行的应用程序可以处于 3 种状态 - { waiting for job、running job、completed job}
扩大规模很好,因为我可以只使用规模 API 并始终请求在 waiting for job 状态下拥有一定比例的 pod
缩小规模时,我想确保 Kubernetes 不会杀死任何处于 running job 状态的 pod。
我应该实现自定义水平 Pod 自动缩放器吗?
我可以为我的 pod 的应用程序状态配置自定义探针吗?
我也可以使用 pod 优先级或 preStop 挂钩
【问题讨论】:
-
您能否再描述一下您的应用程序?例如,用户提交什么来触发工作?这些工作需要访问什么?
标签: kubernetes google-kubernetes-engine kubernetes-pod