【发布时间】:2021-09-29 00:57:48
【问题描述】:
我编写了一些代码来自动化我们公司 vm 实例的训练过程。 您可能知道有时 GCP 目前无法为您提供机器 - “资源不足”异常。
所以,我想监控我的哪些机器成功启动,哪些没有。
如果有某种方式可以在 Bigquery 上显示它,那就太好了。
谢谢。
【问题讨论】:
-
你想对结果做什么?在仪表板中查看?自动重启虚拟机?
-
我有一批训练命令。每个虚拟机实例。我需要将 vm 的数量初始化为我的命令数量。问题是如何处理我无法启动 VM 的情况。 @guillaumeblaquiere
-
您可以使用 Compute Engine API 获取 VM 状态。如果一段时间(大约 30 秒)后没有运行,请尝试再次重新启动它。 IMO,这是一个完美的用例,您可以使用 Cloud Workflow 进行扩展。看看吧。