【发布时间】:2020-03-05 14:45:39
【问题描述】:
我使用的机器是 Titan XP 并运行 Ubuntu 18.10。我不是所有者,所以我不确定它之前是如何配置的。 cuda 版本是 9.*,很可能是 9.0。没有像/usr/local/cuda 这样的文件夹。虽然听起来很奇怪(因为没有 Cuda 与 18.10 兼容),但之前它在 Tensorflow 和 Pytorch 上都运行良好。现在,在 python 2.7、cudatoolkit 9.2 和 cudnn 7.2.1 中运行 tensorflow-gpu v1.12.0 时(之前运行良好,没有任何更改),它报告:
ImportError: libcublas.so.9.0: cannot open shared object file: No such file of directory
但是,当我使用 pytorch 0.4.1、cudatoolkit 9.0 和 cudnn 7.6 将我的 conda env 更改为 python 3.6 时(它们显示在 pycharm 中)。有:
torch.cuda.is_available() # True
这表明 GPU 正在 Pytorch 代码中运行。我还通过nvidia-smi检查了GPU RAM,当Pytorch运行时,RAM被占用了。
虽然没有像/usr/local/cuda/这样的Cuda文件夹,但是当我运行时:
nvcc - V
有:
Cuda compilation tools, release 9.1, V9.1.85
谁能告诉我这些奇怪的事情是如何发生的?我应该怎么做才能使我的 tensorflow-gpu 工作?我完全糊涂了orz。
【问题讨论】:
标签: python tensorflow cuda