【问题标题】:Manage multiple aws accounts管理多个 aws 帐户
【发布时间】:2018-02-03 16:00:21
【问题描述】:

我想知道一个可以跟踪多个 aws 帐户的系统,大约有 130 多个帐户,每个帐户包含大约 200 多个服务器。
我想知道跟踪机器故障、服务故障等的方法。
我还想知道在底层硬件发生故障或机器在现场终止时自动启动机器的方法。
我对所有解决方案持开放态度,包括厨师/terraform 自动化、修复脚本等。

你们将为我节省很多不眠之夜:)

提前致谢!!

【问题讨论】:

  • 这是一个广泛的问题,您也可以考虑使用 AWS 合作伙伴服务提供的产品。您是否探索过任何选择?

标签: amazon-web-services automation monitoring failover self-healing


【解决方案1】:

这纯粹是我对实施您的问题陈述的看法。

1) 嗯.. 要管理和跟踪多个 aws 帐户,您可以使用 AWS Organization。这将帮助您使用一个根帐户集中管理所有其他 130 多个帐户。您也可以启用合并结算。

2) 至于跟踪故障...您可能需要根据您的要求对其进行自定义。 例如: 您可以在docker containers or ecs 之上构建一个微服务,其唯一目的是跟踪故障,生成报告并每天推送到s3。您可以进一步创建在 S3 的报告中使用 AWS quicksight 的仪表板。

可以有另一个微服务来纠正故障。这仅取决于您希望实现的详尽程度和细粒度。

3) 对于 Spot 实例终止时的生成实例,可以通过简单的自动缩放配置来实现。以下是您可能想要阅读的一些文章,它们会给您一些想法:

Using Spot Instances with On-Demand instances

Optimizing Spot Fleet+Docker with High Availability

【讨论】:

  • 谢谢,我会非常彻底地处理您的每一个建议。非常感谢:D
【解决方案2】:

AWS Organisations 对管理很有用。您还可以查看多个帐户billing strategysecurity strategy。与您的 IAM 用户共享服务帐户将使事情变得更容易。

关于跟踪失败,您可以使用 CloudWatch 设置 automatic instance recovery。 CloudWatch 还可以定义警报,当发生意想不到的事情时会通过电子邮件发送给您,尽管单独设置它们可能很耗时。在您的规模下,我认为您应该研究第三方工具。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-12-05
    • 1970-01-01
    • 1970-01-01
    • 2016-04-18
    • 2014-11-19
    • 2015-08-09
    相关资源
    最近更新 更多