Ubuntu 16.04 配置 tensorflow-gpu 计算环境
总的流程是,先装nvidia显卡驱动,再装cuda,再装cudnn,再装tensorflow-gpu。 我的环境:Ubuntu 16.04 + Nvidia GeForce 1060 ,由于系统和硬件不同,安装方法会不一样,这个权当自己的笔记了:-D
# NVIDIA 显卡驱动
参照此文章 https://blog.csdn.net/ghw15221836342/article/details/79571559 另一篇参照 https://blog.csdn.net/Stories_Untold/article/details/78521925
方法一 ppa源安装驱动,操作简便
先在 http://www.nvidia.com/Download/index.aspx?lang=en-us 查看你的设备对应的驱动名称。 然后运行:
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-390 #此处要根据上面查询到的版本适当更改
sudo apt-get install mesa-common-dev
sudo apt-get install freeglut3-dev
2
3
4
5
测试重启之后在终端内输入:nvidia-smi 若出现电脑GPU列表,即安装成功 或者 nvidia-settings #显示你的显卡信息
注意:这个方法,在电脑本身是ubuntu系统下测试没有问题,但据评论里,如果是在虚拟机中,这样装可能会出问题!
方法二 方法二:手动去官网下载.run文件自己安装 详见文章,不赘述了。
# 安装 cuda 9.0
参照此文章 https://blog.csdn.net/qq_35976351/article/details/79325476
安装CUDA® Toolkit 9.0.
CUDA9.0下载地址:https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=deblocal
注意,一定是要是CUDA9.0而不是CUDA9.1
假设我们把CUDA的安装包下载到~/Downloads文件夹中。之后,在这里打开终端,依次输入下面的命令:
sudo dpkg -i cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb
sudo apt-key add /var/cuda-repo-9-0-local/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda
2
3
4
再CUDA完成安装之后,还需要添加环境变量,打开终端,输入下面的命令:
export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
# 如果是64位系统,输入:
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
# 如果是32位系统,输入:
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
2
3
4
5
上述过程完成了整个的CUDA9.0的安装
# 安装cuDNN v7.0.
参照此文章 https://blog.csdn.net/qq_35976351/article/details/79325476
cuDNN v7.0.下载地址:https://developer.nvidia.com/cudnn
这里要选的是 7.3.1 Runtime Library for Ubuntu 16.0 deb
同样的,假设下载目录是~/Downloads,在这里打开终端,之后输入以下命令:
sudo dpkg -i libcudnn7_7.0.5.15-1+cuda9.0_amd64.deb
注意,上述命令中的可能会由于cudnn版本的细微差异而不同,注意tab键补齐就行。之后等待完成cuDNN的安装。
# 安装tensorflow-gpu
pip3 install tensorflow-gpu
就行。
# 注
运行 nvidia-smi
可以查看GPU状态,包括在第一步装完GPU驱动之后查看驱动是否安装成功。
但是走完上述流程后,smi查看却提示 driver/library version mismatch,然后找到了这篇解答: https://stackoverflow.com/questions/43022843/nvidia-nvml-driver-library-version-mismatch
重启大法好,什么也不用做,重启一下机器,一切就好了~
到这里就成功装上了 tensorflow-gpu,可以愉快地训练起来了 /(ㄒoㄒ)/~~