Ubuntu20.04安装NVIDIA显卡驱动+cuda+cudnn配置深度学习环境
乌拉队长 2024-06-10 17:07:03 阅读 67
Ubuntu20.04安装NVIDIA显卡驱动+cuda+cudnn配置深度学习环境
下载驱动和卸载、禁用自带驱动程序
1、查看系统显卡型号
lspci | grep -i nvidia
2、从NVIDIA官网下载相应驱动 https://www.nvidia.com/Download/index.aspx?lang=en-us
3、卸载Ubuntu自带的驱动程序
sudo apt purge nvidia*
4、禁用自带的nouveau nvidia驱动
打开/etc/modprobe.d/blacklist.conf
# 图形化界面可以用gedit打开sudo gedit /etc/modprobe.d/blacklist.conf # 也可以用命令行打开sudo vi /etc/modprobe.d/blacklist.conf # 如果提示没有vi就安装一下: sudo apt install vi
在最后添加如下内容
blacklist nouveau options nouveau modeset=0
然后保存退出。
5、更新
sudo update-initramfs -u
6、重启电脑
sudo reboot
7、重启后查看是否已经将自带的驱动屏蔽了,输入以下代码
lsmod | grep nouveau
没有结果输出,则表示屏蔽成功
安装显卡驱动
8、停止lightdm桌面服务
sudo service lightdm stop
如果提示没有lightdm,就安装一下,再执行上面的命令
sudo apt install -y lightdm
(因为后面使用的命令行界面tty1~7 需要lightdm)
接下来按住键盘的Ctrl+Alt+F1,如果黑屏就切换到tty2,按Ctrl+Alt+F2
如果Ctrl+Alt+F1后还显示图形化桌面就重启一下电脑,之后不要登录,在登录界面直接按Ctrl+Alt+F1或F2,这时应该进了命令行界面了,然后登录root用户或者你的普通用户,如果登录root用户时所有密码都登录失败,一般是因为你装系统时没设置root密码的原因,这时就需要设置一下root账户密码,执行以下命令:
sudo passwd root
然后会让你输入你的普通用户密码,再输入两次root密码,然后就可以在命令行界面登录root账户了。
9、安装驱动
(1)首先查看你有没有安装gcc
gcc --version
如果没有安装gcc一般make也没安装,这时需要安装一下gcc和make
sudo apt install gcc sudo apt install make# 或者直接执行sudo apt install gcc & make # 同时安装gcc和make,不用一条一条执行了,效果和上面两条命令相同
(2)执行安装
cd到你下载的显卡驱动的目录
执行:
sudo chmod a+x NVIDIA-Linux-x86_64-450.80.02.runsudo ./NVIDIA-Linux-x86_64-450.80.02.run -no-x-check -no-nouveau-check -no-opengl-files# -no-x-check:安装时关闭X服务# -no-nouveau-check: 安装时禁用nouveau# -no-opengl-files:只安装驱动文件,不安装OpenGL文件
下面者两个按图中选择,其他默认就好
安装完成以后执行
nvidia-smi
如果显示如下内容则表示安装成功
安装cuda
10、从上面的图中可以看到我的显卡最高可以支持cuda11.0(绿色框内)
下载cuda https://developer.nvidia.com/cuda-toolkit-archive
首先需要知道不同版本的cuda需要的gcc版本是不同的,cuda11.0与gcc的对应关系如下:
其他cuda版本与gcc的版本关系可以在cuda对应版本后面的document—>Installation Guide Linux下找到,不再赘述。
找到自己需要的cuda版本如下选择,最下面虚线框内会给出下载和命令
在终端中执行:
wget http://developer.download.nvidia.com/compute/cuda/11.0.2/local_installers/cuda_11.0.2_450.51.05_linux.run
执行后下载到99%时,可能会报错 “S段错误”,当时搜了半天有说下载的trunk size太小巴拉巴拉的,捣鼓一通也没解决,后来猜测可能时因为文件太大了直接wget才报错的,这时我们用另一个方法进行下载
使用axel进行下载,axel是一个多线程的下载工具,具体是什么请自行百度
11、安装axel
sudo apt install axel# 下载cuda# -n 50 指的是使用50个线程进行下载axel -n 50 http://developer.download.nvidia.com/compute/cuda/11.0.2/local_installers/cuda_11.0.2_450.51.05_linux.run
12、下载完成后进行cuda安装
cd到下载的cuda所在目录
# 安装cudasudo sh cuda_11.0.2_450.51.05_linux.run
可能报错解决方案
如果报下面的错误提示,是因为下载的cuda出错了,重新下载再安装即可。
Extraction failed.
Ensure there is enough space in /tmp and that the installation package is not corrupt Signal caught, cleaning up
正常安装的情况下,会出现下面显示:
这是软件协议,跟普通软件安装时一样,这时输入: accept
在Driver处敲回车,选择不安装驱动,因为之前已经安装过驱动程序,这里是因为每个cuda都会自带一套符合当前版本cuda最低要求的驱动程序,如果这里选择安装的驱动的话,在Windows上安装时会将之前安装的驱动覆盖,但是在linux上覆盖安装的话,可能会出现错误,具体没有试过,如果想试试可以自行测试。我们使用之前自己下载的驱动。
然后按方向键将光标选中最后的Install再回车,开始安装,过一会儿会显示如下:
如果显示如上图,则表示安装完成,这时还不算安装成功,根据上面提示需要配置环境变量,进行如下操作:
# 打开.bashrc文件gedit ~/.bashrc
在文件末尾输入如下内容并保存退出。
# 将下面的11.0替换为你的cuda版本,其他不变,如果不知道自己安装的是哪个版本,就去/usr/local/文件夹下找一下export PATH=/usr/local/cuda-11.0/bin${PATH:+:${PATH}}export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
完事儿以后,执行如下命令更新变量,使其生效
source ~/.bashrc
在终端输入
nvcc -V
如果显示
至此,cuda的安装就算完成了。
安装cudnn
13、下载cudnn https://developer.nvidia.com/rdp/cudnn-download
下载cudnn需要登录账户,可以用QQ或者微信注册一个用户然后登录找到对应cuda版本的cudnn点开找到第一个library点击下载就可以了。
解压下载好的cudnn压缩包,然后执行
# 将文件复制到cuda对应的文件夹下sudo cp cuda/include/cudnn.h /usr/local/cuda/include/sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/# 赋予文件执行权限sudo chmod a+r /usr/local/cuda/include/cudnn.hsudo chmod a+r /usr/local/cuda/lib64/libcudnn*
cuda测试
显卡驱动+cuda+cudnn都安装完成了,当然要试一下能不能用了,接下来我们对其进行测试。
如果安装时安装了sample,那就可以在终端cd到NVIDIA_CUDA-11.0_Samples所在目录,一般默认在/home/你的用户名/NVIDIA_CUDA-11.0_Samples,然后执行make
如果出现如下错误,表示没有安装g++,那么就执行sudo apt install g++,然后再make
如果不出意外,等一会儿会编译通过
然后我们cd到NVIDIA_CUDA-11.0_Samples/1_Utilities/deviceQuery下,执行
./deviceQuery
如果result=PASS表示通过
然后cd到NVIDIA_CUDA-11.0_Samples/1_Utilities/bandwidthTest下,执行:
./bandwidthTest
如果result=PASS表示通过
至此,全部配置完成,如有错误欢迎留言指出。
制作不易,转载请注明出处,谢谢!
声明
本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。