【问题标题】:Could not load dynamic library 'libcupti.so.11.0'; dlerror: libcupti.so.11.0: cannot open shared object file无法加载动态库“libcupti.so.11.0”; dlerror: libcupti.so.11.0: 无法打开共享对象文件
【发布时间】:2021-05-02 02:54:50
【问题描述】:
系统信息
- 操作系统平台和发行版(例如,Linux Ubuntu 18.04)
- Ubuntu 20.04
- Python 版本:3.6
- 使用 virtualenv 安装
- CUDA/cuDNN 版本:11.5 / 8.1.0.77
- GPU 型号和内存:RTX 3090 24GB nvidia 驱动程序 460.39
- TensorFlow 版本:2.4.0 pip install tensorflow-gpu==2.4.0
描述问题
安装了 cuda 11.2 和 cudnn 8.1.0.77。运行 train.py 时遇到以下问题
无法加载动态库“libcupti.so.11.0”; dlerror: libcupti.so.11.0: 无法打开共享对象文件
【问题讨论】:
标签:
python
tensorflow
virtualenv
ubuntu-18.04
【解决方案1】:
解决了问题
-
列出/usr/local/cuda-11.2/extras/CUPTI/lib64/lib*上的lib文件
$ ls /usr/local/cuda-11.2/extras/CUPTI/lib64/lib*
-
我找不到libcupti.so.11.0。其他文件应该在那里,例如libcupti.so,libcupti.so.11.2,...
-
使用命令 'sudo ln -s' 管理 libcupti.so.11.2 和 libcupti.so.11.0 之间的链接
$ sudo ln -s /usr/local/cuda-11.2/extras/CUPTI/lib64/libcupti.so.11.2 /usr/local/cuda-11.2/extras/CUPTI/lib64/libcupti.so.11.0
-
列出 /usr/lib/x86_64-linux-gnu/libcup* 上的 lib 文件
ls /usr/lib/x86_64-linux-gnu/libcup*
-
我找不到libcupti.so.11.0。其他文件应该在那里
那libcupti.so, libcupti.so,2, libcupti.so.10.1, ...
-
使用命令sudo ln -s 管理libcupti.so.11.2 和libcupti.so.11.0 之间的链接
$ sudo ln -s /usr/local/cuda-11.2/extras/CUPTI/lib64/libcupti.so.11.2 /usr/lib/x86_64-linux-gnu/libcupti.so.11.0
这解决了我的问题
【解决方案2】:
对于 Cuda-11.3,lib64 文件夹从 /usr/local/cuda-11.2/extras/CUPTI/ 中删除。所有 lib 文件都移动到 ls /usr/local/cuda/lib64/ 或 ls /usr/local/cuda-11.3/lib64/。
-
列出 /usr/local/cuda/lib64/ 上的 lib 文件
$ ls /usr/local/cuda/lib64/libcupti*
-
我找不到 libcupti.so.11.0。其他文件应该在那里,例如 libcupti.so、libcupti.so.11.3、...
-
使用命令“sudo ln -s”管理 libcupti.so.11.3 和 libcupti.so.11.0 之间的链接
$ sudo ln -s /usr/local/cuda-11.3/lib64/libcupti.so.11.3 /usr/local/cuda-11.3/lib64/libcupti.so.11.0
就是这样。享受