【问题标题】:Reduce SNS alerts ofr failed ECS tasks减少失败的 ECS 任务的 SNS 警报
【发布时间】:2022-06-23 23:40:40
【问题描述】:
我已经创建了 ECS 任务,但由于某种原因它失败了,并且对于警报服务,我使用了与我的松弛通道集成的 SNS。当容器无法启动时......它会发出警报,并且它具有每次都不断重新启动直到手动停止的属性,并且每次重新启动时......它都会发出警报......我想减少这些警报,,是有某种方式我可以做到这一点。就像将代码放在事件规则中或在其中添加条件循环一样。请帮助...以下是用于两种情况的代码:
【问题讨论】:
标签:
amazon-web-services
aws-lambda
devops
amazon-ecs
amazon-sns
【解决方案1】:
正在替换任务和容器,而不是重新启动。我认为没有任何方法可以减少发出的警报数量,因为每次都是新任务。至少不能直接使用 EventBridge/SNS。
您可以创建一个 CloudWatch 警报来监控正在运行的任务的数量,并让它在计数为 0(或低于某个阈值)时向您的 SNS 主题发送警报。 CloudWatch 警报具有评估期等设置,您可以调整这些设置以防止发生过多警报,并且它也只会在计数发生变化时发送警报,而不是在每次 ECS 任务部署尝试时发送警报。