【发布时间】:2018-02-03 16:00:21
【问题描述】:
我想知道一个可以跟踪多个 aws 帐户的系统,大约有 130 多个帐户,每个帐户包含大约 200 多个服务器。
我想知道跟踪机器故障、服务故障等的方法。
我还想知道在底层硬件发生故障或机器在现场终止时自动启动机器的方法。
我对所有解决方案持开放态度,包括厨师/terraform 自动化、修复脚本等。
你们将为我节省很多不眠之夜:)
提前致谢!!
【问题讨论】:
-
这是一个广泛的问题,您也可以考虑使用 AWS 合作伙伴服务提供的产品。您是否探索过任何选择?
标签: amazon-web-services automation monitoring failover self-healing