【问题标题】:nvidia-smi command could communicate with nvidia driver microsoft azure dsvmnvidia-smi 命令可以与 nvidia 驱动程序 microsoft azure dsvm 通信
【发布时间】:2018-11-25 18:41:08
【问题描述】:

在创建并启动数据科学虚拟机并通过 ssh 连接后,我尝试使用 nvidia-smi 查看内置的 nvidia 和 cuda 是否正常工作。返回的消息已读

NVIDIA-SMI 失败,因为它无法与 NVIDIA 通信 司机。确保安装了最新的 NVIDIA 驱动程序并且 正在运行。

这些应该是 vm 的一部分,但是当我尝试运行我创建的程序时,使用的是本地计算机的默认 CPU,而不是 vm 的 GPU。我项目的最终目标是运行一个对象检测模型,其性能从我糟糕的 11 秒/图像中加速,所以我想我会使用 vm 并利用它的计算能力。然而,这似乎不是最好的选择,所以如果其他人有一些建议,我将不胜感激。

【问题讨论】:

  • 你用的是什么系列的虚拟机?只有 N 系列 VM 有 GPU
  • 我正在使用带有 DS3_v2 SKU 的 Linux 数据科学虚拟机 (Ubuntu)。我应该使用其他东西吗?

标签: nvidia azure-virtual-machine


【解决方案1】:

您看到的问题是因为您使用的是 D 系列 VM。只有 N 系列 VM 有 GPU。因此,为了利用 GPU,您需要选择以下尺寸之一:

https://docs.microsoft.com/en-us/azure/virtual-machines/windows/sizes-gpu

对于这个大小系列,您订阅中的 vCPU(核心)配额最初在每个区域中设置为 0。您需要在可用区域中为该家庭提供request a vCPU quota increase

【讨论】:

  • 我有一台 N 系列机器,但即使在安装了最新的 nvidia-drivers 之后,我也遇到了同样的错误。有关如何解决此问题的任何建议?
  • 这里也一样,我已经使用 DSVM 作为基础镜像,它应该包含几乎所有需要的内容,但似乎代理/管道仍在阻止使用...
猜你喜欢
  • 1970-01-01
  • 2017-08-16
  • 2022-07-04
  • 2018-08-17
  • 2021-07-08
  • 2020-10-23
  • 2023-03-31
  • 1970-01-01
  • 2022-06-25
相关资源
最近更新 更多