【发布时间】:2022-07-21 22:20:10
【问题描述】:
挑战
扩展 Spot 节点组失败并显示 AsgInstanceLaunchFailures,因为它“无法启动 Spot 实例。UnfulfillableCapacity - 由于您的请求配置,无法满足容量。请调整您的请求并重试。启动 EC2 实例失败。”
发生该错误后,节点组降级,不再安排新实例。
一旦实例再次可用,我该如何解决这个问题,以便节点组正常工作?
设置
我使用了terraform-aws-eks-blueprints-repo 并为自己构建了一个 EKS 集群。该集群具有以下托管节点组。
- 现货 - eu-central-1 - a
- 现货 - eu-central-1 - b
- 现货 - eu-central-1 - c
- 按需 - eu-central-1 - a
- 按需 - eu-central-1 - b
- 按需 - eu-central-1 - c
最重要的是,我将cluster-autoscaler-priority-expander 配置为首先使用现场然后按需使用。
2022-05-13 更新:我只使用了 m5.large,现在添加了更多类型来解决这个问题。有了这个扩展集,到目前为止似乎没有问题。我仍然很想知道如何解决这个问题,好像 SPOT 根本不可用,我的集群会失败......这不是一个好的前景。
2022 年 5 月 19 日更新: 我与 AWS 聊天,他们声称它是 issue which there is no solution so far。由于自动缩放组没有“降级”,因此集群自动缩放器只是认为它是。对我来说,这听起来像是想要进入的障碍......所以,如果有人有解决方案,我会敞开心扉。
【问题讨论】:
-
如果我的一个 ASG 用于 Spot 实例(也在 eu-central-1 中),我也会遇到完全相同的“无法满足容量”错误。目前尚不清楚要更改什么来解决此问题。可能是 AWS 服务降级?
-
您可能还想添加对您来说失败的 EC2 实例类型。
-
我更新了有关实例类型的消息。
-
几乎在同一时间范围内遇到类似问题。 AWS 控制台应提供信息,无论是 AWS 方面的问题还是客户方面的问题,以及如何解决它的任何指导。
标签: amazon-web-services kubernetes amazon-eks autoscaling aws-auto-scaling