【问题标题】:AWS - EC2 Auto Scaling Health Check in relation to Cool DownAWS - 与冷却相关的 EC2 Auto Scaling 运行状况检查
【发布时间】:2020-10-28 07:08:27
【问题描述】:

我有一个 Amazon EC2 Auto Scaling 组,运行状况检查时间为 5 分钟以标记实例运行状况良好,默认冷却时间为 4 分钟。我有一个扩展策略,它将检查 n 个数据点的 CPU 使用率是否为 70%,持续 1 分钟并添加 n 个实例。

我会有问题吗?扩展策略是否添加到默认冷却时间?我的理解是,由于我的默认冷却时间少于我的健康检查时间,我会遇到问题。

场景:当新实例启动且运行状况检查尚未通过(5 分钟)并且发生另一次扩展(4 分钟)时。这是一个问题还是有效的声明?

提前致谢。

【问题讨论】:

  • 这取决于扩展策略。那么您使用什么扩展策略呢?例如,目标扩展策略可以在不等待冷却时间结束的情况下启动新实例。
  • 我有 2 个简单的扩展策略。 CPUUtilization 70 持续 60 秒 添加 3 个实例等待:240 秒后允许另一个扩展活动

标签: amazon-web-services amazon-ec2 aws-auto-scaling


【解决方案1】:

您可能不想一次添加这么多实例。尝试将扩展策略配置为一次添加/删除一个实例,而不是删除 2 和添加 3。

运行状况检查用于识别不健康的实例并在 Auto Scaling 组中删除/替换它们。

冷却时间用于避免在指标稳定为常规模式之前添加/删除实例。例如,一个实例可能需要一段时间才能开始接受请求,这可能会影响您用于扩展的指标。

您实际上不必担心它们如何相互交互,但请确保运行状况检查有足够的时间让实例开始响应查询。

【讨论】:

  • 谢谢你,@John。跟进问题,关于你的最后一点。有很多情况下,新实例在通过健康检查并被标记为健康实例后获得 90% 的 cpu 利用率,这是应用程序问题吗?这是我在上面问过的冷却和健康检查的困境。再次感谢。
  • CPU 利用率指标计算为 Auto Scaling 组中 所有 个 Amazon EC2 实例的平均值。虽然某些实例可能“忙碌”,但该指标与所有实例平均的忙碌程度有关。健康检查与扩展指标无关——它只是检查实例是否响应请求。
猜你喜欢
  • 2014-04-20
  • 2019-08-21
  • 2012-09-30
  • 2020-10-05
  • 2016-01-05
  • 2019-12-16
  • 2021-06-26
  • 2019-09-16
  • 1970-01-01
相关资源
最近更新 更多