【问题标题】:Debug Google App Engine deploy health check failure调试 Google App Engine 部署运行状况检查失败
【发布时间】:2024-05-04 06:00:03
【问题描述】:

上下文:运行gcloud app deploy,每次都看到这些错误:

ERROR: (gcloud.app.deploy) Error Response: [4] Timed out waiting for the app infrastructure to become healthy.

(gcloud.app.deploy) Error Response: [4] Your deployment has failed to become healthy in the allotted time and therefore was rolled back.

据我所知,没有很好的调试方法。在过去的几天里,我一直在黑暗中拍摄这个问题。我现在也阅读了无数与此问题相关的问题和答案。 GCP 是否提供任何调试方法?或者比“它未能变得健康”更详细的日志?

【问题讨论】:

    标签: google-app-engine google-cloud-platform


    【解决方案1】:

    似乎有一些可用选项可用于进一步排除故障和调试应用程序。

    如官方文档Troubleshooting App Engine flexible deployment 中所示,表示您可以使用以下两个选项之一来进一步调试您的 App Engine - 包括 App Engine Standard,以防您不使用 Flexible。

    1. 在 Google Cloud Console 中,通过 SSH 连接到您的虚拟机。有关详细信息,请参阅连接到实例。

    2. 使用文本查看器,例如tail

      tail -f /var/log/nginx/error.log

    我相信这些方法应该可以帮助您在排除和调试 App Engine 应用程序方面提供更多选择。

    除此之外,其他文档也可能对您有所帮助:Viewing logs Classic

    如果这些信息对您有帮助,请告诉我!

    【讨论】:

    • 在新实例通过初始运行状况检查以完成部署之前,您无法通过 SSH 连接到新实例。如果我使用 gcloud 列出实例,我可以获得新实例,但是如果我尝试为实例启用调试模式,我会得到 ABORTED: Cannot operate on ... because an operation is already in progress. 如果我尝试 ssh 进入它,我会得到同样的错误。我在其他地方提供的其他日志显示了推送 Docker 容器后的所有内容。然后它是一个正在进行健康检查的黑匣子。
    • 嗨@Jacquen 感谢您的确认!搜索您现在提到的这个错误,根据谷歌支持工程师回答here,它可能与您的 Cloud SDK 版本有关。所以,更新它,可能是一个很好的测试。无论如何,他们似乎建议您直接与他们联系,以便更好地进行故障排除。您可以使用此链接here 联系他们的支持。
    最近更新 更多