【问题标题】:Different order between nvidia-smi and nvidia x server settingsnvidia-smi 和 nvidia x 服务器设置之间的顺序不同
【发布时间】:2019-04-13 01:35:23
【问题描述】:

当我运行命令 nvidia-smi 时,我得到以下两个按总线 ID 排序的 GPU:

对于 GPU 0,00000000:0A:00.0

对于 GPU 1,00000000:41:00.0

但是,当我运行 NVIDIA X server Settings 时,我可以获得以下按总线 ID 排序的 GPU:

对于 GPU 0,PCI:65:0:0

对于 GPU 1,PCI:10:0:0

因此,它们根据自己的枚举总线 ID 的方式有不同的顺序。 有什么办法可以让订单一致吗?

操作系统:Ubuntu 16.04 主板:微星 X399(适用于 AMD 1950X)

(PS) 事实上,当我在多个 GPU 上使用dataparallel 机制进行深度学习时,我的电脑就死机了。我猜是 GPU 顺序不同的原因。

【问题讨论】:

    标签: ubuntu cuda gpu nvidia pci-e


    【解决方案1】:

    重要的顺序是 CUDA 顺序。

    您可以enumerate CUDA 设备,看看哪个是哪个。

    然后,您将能够使用 CUDA_VISIBLE_DEVICEScudaSetDevice()cuCtxCreate() 在未用于显示的 GPU 上运行程序

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2014-11-25
      • 1970-01-01
      • 2022-07-04
      • 2019-04-24
      相关资源
      最近更新 更多