【发布时间】:2021-07-24 12:25:28
【问题描述】:
我正在使用A100-SXM4-40GB Gpu,但训练速度非常慢。我尝试了两个模型,一个是 cifar 的简单分类,一个是 Cityscapes 的 Unet。我在其他 GPU 上尝试了我的代码,它工作得非常好,但我不知道为什么在这个大容量 GPU 上训练超级慢。
我将不胜感激。
以下是 GPU 的其他一些属性。
GPU 0: A100-SXM4-40GB
GPU 1: A100-SXM4-40GB
GPU 2: A100-SXM4-40GB
GPU 3: A100-SXM4-40GB
- 英伟达驱动版本:460.32.03
- cuDNN 版本:无法收集
【问题讨论】:
-
您确定正在使用 GPU 吗?培训前免费吗?
-
我确信 GPU 是免费的,但我想知道的是,当我的模型正在训练时,当我检查 nvidia-smi 时,它不会在任何 gpus 上显示任何进程
-
所以,GPU 没有被使用。
torch.cuda.is_available()的输出是什么? -
我在我的代码中设置了这一行
self.device = torch.device(f'cuda:{self.gpu}' if torch.cuda.is_available() else 'cpu'),我想既然我将self.gpu设置为我希望在其上运行的gpu的名称,它是在GPU上实现的。我现在会检查它。 -
是的,它在 CPU 上运行