【问题标题】:Upgrading GCP deep learning VM gives error升级 GCP 深度学习 VM 时出错
【发布时间】:2021-04-07 17:42:03
【问题描述】:

我正在尝试将 VM 从 M58 升级到 M66,以便可以使用 PyTorch 1.8。 “编辑VM详细信息”上的升级按钮导致“此操作无法完成”。知道为什么会出现这种情况以及发生这种情况时该怎么办吗?

【问题讨论】:

  • 您是如何创建虚拟机的?使用 Marketplace 或 gcloud 命令?也许只使用控制台。另外,当您提到“M58”时,您的意思是使用 58 个 vCPU 优化内存?最后,当您尝试升级时,VM 是否已停止?通常日志中会包含更多信息,您可能需要查看并在此处分享信息。
  • 它是在 Marketplace 上创建的。 M58 是当前列出的环境版本。我最终只是创建了一个新的虚拟机并使用 gcloud 命令将所有内容复制到新的虚拟机上。工作得很好,似乎比挖掘日志更快哈哈
  • 大声笑,你是对的。因此,考虑到这一点,我将添加一个答案,实际上,我注意到 GCP 没有“升级市场解决方案”文档,因为它非常依赖于解决方案。所以....检查答案。

标签: google-cloud-platform google-dl-platform


【解决方案1】:

一般而言,升级 Marketplace 解决方案并不是最好的方法,相反,最好保留解决方案一次性并在需要时重新部署新版本,然后将所有信息和配置移至该新版本。

这是因为市场解决方案依赖于合作伙伴而不依赖于 GCP,此外,GCP 甚至没有关于升级市场解决方案的官方文档(它确实有 this 来管理部署,但它并没有谈论太多升级)。

所以,当您决定只部署新版本时,您做出了正确的选择。

【讨论】:

    【解决方案2】:

    有关参考,请参阅升级笔记本实例的环境document。 您可以使用is-upgradeable API 端点来确定升级资格。

    gcloud notebooks instances is-upgradeable <notebook-name> --location=<location>
    

    【讨论】: