【问题标题】:Can't create GPU instances on GCE无法在 GCE 上创建 GPU 实例
【发布时间】:2021-06-05 20:42:21
【问题描述】:

我正在尝试在 Compute Engine 上创建一个 GPU 实例(n1-standard-2 和 1 个 NVIDIA T4 GPU),但我从昨天开始就收到此错误:

Operation type [insert] failed with message "The zone 'projects/deep-learning-xxxx/zones/us-central1-a' does not have enough resources available to fulfill the request. Try a different zone, or try again later."

Google Cloud 的这个区域似乎没有足够的 GPU 资源,但是我在其他区域也遇到了同样的错误,并且在尝试了多次之后。不过,常规的非 GPU 实例运行良好。我想弄清楚我是否做错了什么,或者现在 GCP 上是否存在对 GPU 实例的巨大需求。

【问题讨论】:

  • 你检查过你的quotas吗?
  • 正确。 GPU 是稀有资源(在云中、对于游戏玩家、对于矿工......),您可能正处于非常苛刻的时期!
  • @ClarkMcCauley,是的,我添加了 GPU 所需的每个区域配额和全局 GPU 配额。好像和那个没有关系。

标签: google-cloud-platform google-compute-engine


【解决方案1】:

未在特定区域/区域的 VM 上创建 GPU 的原因可能是,

1.资源不可用。在此处查看资源可用性GPU availability across regions and zones

2.配额过度使用会限制GPU的创建。详情请参考Checking project quota

3.GCP限制少,可以参考Restrictions的列表。

您可以在Create VM with GPU's查看GPU配额

另外,GCP 提供了一个名为 Reserving Compute Engine zonal resources 的功能,以确保您的项目有资源供将来使用。

【讨论】:

    【解决方案2】:

    最后,我能够毫无问题地启动 preemptible GPU 实例。因此,Google Cloud 目前似乎没有足够的 GPU 资源来预留按需 GPU 虚拟机。

    【讨论】:

      猜你喜欢
      • 2016-12-12
      • 2019-05-26
      • 1970-01-01
      • 1970-01-01
      • 2013-06-26
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多