小菜鸟一枚,用了两天的时间才把环境装好,下面小小的记录一下这两天的踩坑过程。
首先介绍几个名词(copy自雷神师兄的文章):
(1)ubuntu16.04:大名鼎鼎的一个linux发行版,以桌面系统的强大得到广大用户青睐(特别是刚入门的小白用户),16.04表示2016.04发布的,该系统每年4月和10月发布两个版本,即04和10,年份为偶数的版本最稳定,比如12.04,14.04,16.04等就被广泛使用。
(2)tensorflow:一个google开源的深度学习框架,封装了很多机器学习的算法即模型,我们拿来就可以用了,鉴于谷歌的影响力,tensorflow目前也是大红大紫。目前(2017-3-20)最新版本为1.0,该框架更新很快。
(3)CUDA:显卡厂商NVIDIA推出的通用并行运算平台,由于机器学习数据量很大,通常要用GPU来加速运算,而当今显卡厂商唯NVIDIA一家独大,自然要用打它家的CUDA了。
(4)cudnn:NVIDIA专门为深度学习设计的一套GPU计算加速方案。
一.安装NVIDIA驱动和CUDA
以下内容参考https://blog.csdn.net/chenhaifeng2016/article/details/68957732
sudo vim /etc/modprobe.d/blacklist.conf
在文件最后部分插入以下两行内容
blacklist nouveau
options nouveau modeset=0
3.更新系统sudo update-initramfs -u
4.重启系统(一定要重启)5.验证nouveau是否已禁用
lsmod | grep nouveau
没有信息显示,说明nouveau已被禁用,接下来可以安装nvidia的显卡驱动。
6.按ctrl+alt+f1进入文本模式(不然不能安装成功)
sudo service lightdm stop(关闭图形界面)
7.运行cuda_8.0.61_375.26_linux.run
sudo ./cuda_8.0.61_375.26_linux.run
我的跟以上的一样的。
不要安装opengl,不然即使安装成功,也会出现循环登录的情况(至少本人碰到了这样的情况)。
不要安装/usr/local/cuda的符号连接(这一步可选)
8.sudo service lightdm start (打开图形界面)
注:nvidia驱动不要重复安装,否则会碰到无法进入图形界面的黑屏问题。只要卸载掉多余的驱动就可以了。
卸载:sudo apt-get purge nvidia-*
二.安装CUDNN
1.安装CUDNN过程参考https://blog.csdn.net/lldbsd/article/details/64213949 没什么问题NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
上面问题参考:https://blog.csdn.net/w5688414/article/details/78287199
然后重启一下就可以了。
三.安装Tensorflow-gpu
1.安装python-pip和python-devpip install tensorflow-gpu
但我执行这个安装失败,后来在后面加1.0就可以了
sudo pip install tensorflow-gpu==1.0
3.测试:终端输入: python
再输入:import tensorflow as tf
成功!中间遇到了很多问题,也学习到了很多东西,由于安装的时间太久了,记录的可能有所欠缺。后面会继续努力!