【问题标题】:Google Cloud auto-scaling thrashes between 0 and 1, even with minimum of 1Google Cloud 自动缩放在 0 和 1 之间波动,即使最小为 1
【发布时间】:2018-04-25 11:46:03
【问题描述】:

我有一个启用了自动缩放的托管实例组。我有最少 1 和最多 10 的健康检查和 cpu 0.8

实例数不断在 0 和 1 之间切换。每隔几分钟。我找不到 GCP 决定删除实例然后立即将其添加回来的原因。运行状况检查在任何地方都没有日志。

更令人担忧的是违反了所需的最小实例数。

想法?谢谢!

编辑:这可能是由于实例变得不健康,很可能是因为需要防火墙规则来允许对实例进行健康检查。运行状况检查适用于负载平衡,但似乎不适用于实例运行状况。我使用的是自定义网络,所以我需要添加防火墙规则。

https://cloud.google.com/compute/docs/load-balancing/health-checks#configure_a_firewall_rule_to_allow_health_checking

将在一段时间后确认/更新。

【问题讨论】:

    标签: google-compute-engine autoscaling


    【解决方案1】:

    不要混淆两种不同的功能:自动修复和 托管实例组的自动缩放。

    • --min-num-replicas 是自动缩放器的一个参数,设置此参数可以确保目标实例数永远不会低于某个阈值。但是,自动修复会自行工作,而不是遵循自动缩放的配置。

    因此,当实例属于托管组且未通过运行状况检查时,如果启用自动修复而不考虑最小副本数,它们将被视为死实例并从池中删除。

    最好的做法是验证health checks 是否正常工作,以避免此类不当行为。常见问题有:

    • 防火墙规则

    • 错误的协议/端口

    • 机器开机时服务器未自动启动

    还要注意,如果运行状况检查有点复杂并且与某种软件交互,您需要确保实例已启动,然后再进行相应的配置initial delay flag,即实例运行的时间长度已知正在初始化,即使不健康也不应该自动修复。

    【讨论】:

      猜你喜欢
      • 2020-08-01
      • 1970-01-01
      • 1970-01-01
      • 2020-03-30
      • 1970-01-01
      • 2011-10-27
      • 2021-11-04
      • 1970-01-01
      • 2015-10-18
      相关资源
      最近更新 更多