感谢@joão gabriel s.f.我能够成功卸载 CUDA 8.0/cuDNN 5.1 并安装最新版本的 tensorflow。由于整个过程对我来说有点混乱,我决定发布一个快速演练,也许可以帮助处于相同情况的人。
卸载
首先,我卸载了 cuda 及其所有依赖项。当我通过包管理器安装它时,我使用了 apt-get 来删除它。对于运行文件的安装,您可以查看this。
sudo apt-get --purge remove cuda
sudo apt-get autoremove
dpkg --list |grep "^rc" | cut -d " " -f 3 | xargs sudo dpkg --purge
另外,我检查了 /usr/local/ 中的任何 cuda 文件夹并将它们删除。关于cuDNN,通过删除所有cuda文件夹,对应的cuda headers和libs已经被删除。
安装
先检查显卡驱动。 CUDA 9.0 与 v384.111 驱动程序一起工作(因此不需要 390.xxx),所以我在这里无事可做。
我下载了 CUDA Toolkit 9.0 here 作为 deb(本地)。在同一个文件夹中,我执行了
dpkg -i cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb
sudo apt-key add /var/cuda-repo-9-0-local/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda
然后设置环境变量:
export PATH=${PATH}:/usr/local/cuda-9.0/bin
export CUDA_HOME=${CUDA_HOME}:/usr/local/cuda:/usr/local/cuda-9.0
export LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:/usr/local/cuda-9.0/lib64
之后我按照here 的描述验证了我的安装。
我从存档中下载了 cuDNN 7.1 作为 tarball 并通过
安装了它
tar -xzvf cudnn-9.0-linux-x64-v7.1.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h \
/usr/local/cuda/lib64/libcudnn*
启动 Python bash 后,我能够导入 tensorflow 并运行一个简单的图表。
再次感谢,祝您度过愉快的一周!