【发布时间】:2023-03-12 12:20:01
【问题描述】:
我正在部署一个 AutoScalingGroup,其中包含由 CloudWatch 警报 (CPU > 70%, CPU < 10%) 触发的 AutoScalingPolicies(ScaleUp 和 ScaleDown)。
AutoScaling 运行良好,但是...一旦 AutoScalingGroup 达到最小实例数 (2),CPU < 10% 警报会在 ALARM STATE 中停留数小时...天...而不重置为 OK STATE .
因为 CPU 利用率保持在 10% 以下,所以我知道警报永远不会回到 OK STATE 是正常的。
我知道它存在一些 AlarmActions 之类的:
arn:aws:automate:${AWS::Region}:ec2:recover(用于 EC2)
我搜索了类似的 Cloudwatch 操作,没有找到任何东西。
我有一个自定义解决方案:使用 Lambda 更改 Alarm State to OK,但我想知道是否存在更智能/更简单的解决方案。
有人知道怎么做吗?
谢谢。
【问题讨论】:
标签: amazon-web-services amazon-cloudwatch cloudwatch-alarms