【发布时间】:2018-11-02 15:21:43
【问题描述】:
有没有其他人在他们的弹性 beanstalk 应用程序上看到零星的健康检查失败?
我正在使用 ELB 来提供 GraphQL API。我正在单个 t2.micro 实例上运行 docker 配置,监控间隔设置为 1 分钟。它设置为在重负载时最多扩展到 4 个实例。数据存储使用 Amazon RDS(PostgreSQL,非公开,db.t2.micro)。
以下是我的 ELB 事件页面的最新值:
2018-05-23 08:24:11 UTC-0600 INFO
Environment health has transitioned from Severe to Ok.
2018-05-23 08:23:11 UTC-0600 WARN
Environment health has transitioned from Ok to Severe. None of the instances are sending data.
2018-05-21 06:28:13 UTC-0600 INFO
Environment health has transitioned from Severe to Ok.
2018-05-21 06:27:13 UTC-0600 WARN
Environment health has transitioned from Ok to Severe. 85.7 % of the requests are erroring with HTTP 4xx.
2018-05-18 14:10:51 UTC-0600 INFO
Environment health has transitioned from Severe to Ok.
自几个月前部署我的应用程序以来,我偶尔会看到 HTTP 4XX 警告。我以前从未见过None of the instances are sending data 警告。我在我的应用程序日志中没有看到任何匹配的 4XX 错误。
不确定这是否正常,或者我是否配置错误。 Amazon Compute 在其服务承诺部分here 中宣传 99.99% 的 SLA 级别。 我预计会看到以下范围内的停机时间:
- 每天:8.6s
- 每周:1m 0.5s
- 每月:4m 23.0s
- 年:52m 35.7s
我在外部运行状况检查中没有看到任何错误(我使用 UptimeRobot,它每五分钟轮询一次 API 的运行状况端点并搜索关键字)。我在我的应用程序日志中没有看到任何错误。
如果其他人看到闪烁的健康状况并找到了缓解这种情况的方法(或者至少是为什么会发生这种情况),我将不胜感激。感谢阅读!
【问题讨论】:
标签: performance amazon-web-services web-applications amazon-elastic-beanstalk