【深度学习环境配置】ubuntu 20.04+4060 Ti+CUDA 11.8+pytorch(装机、显卡驱动、CUDA、cudnn、pytorch)

CSDN 2024-07-01 12:37:03 阅读 85

文章目录

如何安装ubuntu20.04系统总体安装流程参考0. ubuntu 换源1. 禁用nouveau2. 安装gcc2.5 安装python3. :star2::star2::star2:安装显卡驱动 (此步很重要)4. 安装cuda5. 安装miniconda6. 安装cudnn7. 安装pytorch8. 所有都安装成功,验证cuda,pytorch,cudnn9. 安装编辑器,如pycharm10. 其他参考博客

【深度学习环境配置】ubuntu 20.04+4060 Ti+CUDA 11.8+pytorch(装机、显卡驱动、CUDA、cudnn、pytorch)

📆 安装时间 2023.11.08-2023.11.10

如何安装ubuntu20.04系统

Windows 和 Ubuntu 双系统的安装和卸载

B站教程

总体安装流程参考

【本文基本上跟这个详细教程一致,优先推荐看这个!】ubuntu20.04 下深度学习环境配置 史上最详细教程

【精品!】Ubuntu20.04下深度学习环境配置(持续维护)

一文掌握Ubuntu20.04深度学习环境搭建(显卡驱动、CUDA、CUDNN、NCCL、Pytorch、PaddlePaddle)

Ubuntu20.04配置深度学习环境

0. ubuntu 换源

20.04Ubuntu换源,有清华,中科大,阿里源

这个也是讲如何换源,跟第一个差不多,可以参考看看

pip换源与conda换源

pip临时和永久换源

主要结合这个的流程换源,精品文章

sudo cp /etc/apt/sources.list /etc/apt/sources.list.backup

sudo gedit /etc/apt/sources.list

将原有的源都加#注释,在最后换成自己想要的源

换阿里源结果

在这里插入图片描述

更新

sudo apt-get update

sudo apt-get upgrade


在这里插入图片描述


阿里云

deb http://mirrors.aliyun.com/ubuntu/ focal main restricted

deb http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted

deb http://mirrors.aliyun.com/ubuntu/ focal universe

deb http://mirrors.aliyun.com/ubuntu/ focal-updates universe

deb http://mirrors.aliyun.com/ubuntu/ focal multiverse

deb http://mirrors.aliyun.com/ubuntu/ focal-updates multiverse

deb http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse

deb http://mirrors.aliyun.com/ubuntu/ focal-security main restricted

deb http://mirrors.aliyun.com/ubuntu/ focal-security universe

deb http://mirrors.aliyun.com/ubuntu/ focal-security multiverse


1. 禁用nouveau

如何禁用nouveau,就按照这个精品文章来

// 修改属性

sudo chmod 666 /etc/modprobe.d/blacklist.conf

//用gedit打开

sudo gedit /etc/modprobe.d/blacklist.conf

// 在最后一行加入以下几句,保存退出

blacklist vga16fb

blacklist nouveau

blacklist rivafb

blacklist rivatv

blacklist nvidiafb

// 对刚才修改的文件进行更新

sudo update-initramfs -u

记得重启计算机,打开终端检查nouveau是否被禁用

若执行完该句,没有任何输出,则nouveau被成功禁用

lsmod | grep nouveau

2. 安装gcc

如何安装gcc,也按照这个精品文章来

安装gcc,不要怀疑,就是build-essential,我也不知道为啥

sudo apt-get install build-essential

检查gcc是否安装成功

gcc --version

在这里插入图片描述

2.5 安装python

是按照这个博客的流程安装python的,感觉也不用安装

sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 150

在这里插入图片描述

3. 🌟🌟🌟安装显卡驱动 (此步很重要)

如何在没有安装显卡驱动,不能用nvidia-smi情况下,查看显卡型号


参考这个博客的方法安装显卡驱动,只安驱动,不安cuda toolkit

⭐️ 这个安装方式不会黑屏

注:如果哪天因为安装驱动黑屏了,看这个!有效!

软件和更新中安装,图标长下面这样

软件和更新

要注意cuda版本对显卡驱动有要求, 官网要求

显卡、显卡驱动版本、cuda版本和Pytorch相互之间的依赖关系

在这里插入图片描述

按照下图的选择安装,点击应用更改开始安装,这里安装525版本的显卡驱动,

在这里插入图片描述

然后启动终端,分别进行命令sudo apt updatesudo apt upgrade(两个命令顺序不可乱)手动对刚刚的更改进行更新(有点慢,耐心等待)。之后重启!重启!重启!!

第四步,使用命令nvidia-smi查看驱动是否成功

检查显卡驱动是否正常

nvidia-smi

在这里插入图片描述

关于nvidia-smi 显示的cuda版本的说明

按照上述博客,上图的CUDA Version:12.0指的是最高支持cuda12.0的版本,并不是已经安装cuda12.0的版本,可以安装cuda11.8版本

4. 安装cuda

这个也挺好的,可以看一下整个安装流程,有验证,Ububtu20.04 CUDA安装与环境配置、CUDNN安装


如何卸载cuda和显卡驱动

如果需要卸载已经安装的CUDA和nvidia驱动,输入下面两条命令

#To remove CUDA Toolkit:

sudo apt-get --purge remove "*cuda*" "*cublas*" "*cufft*" "*cufile*" "*curand*" \

"*cusolver*" "*cusparse*" "*gds-tools*" "*npp*" "*nvjpeg*" "nsight*" "*nvvm*"

#To remove NVIDIA Drivers:

sudo apt-get --purge remove "*nvidia*" "libxnvctrl*"

#To clean up the uninstall:

sudo apt-get autoremove

别忘了再执行下面的命令

sudo rm -rf /usr/local/cuda-xx.x

为什么加入这句,看这个博客

最后边加了一句sudo rm -rf /usr/local/cuda-xx.x,这是因为一般情况下cuda都配置了cudnn,在运行卸载程序时只会卸载cuda而不会一并删除cudnn的文件。因为cudnn文件还在的缘故,自己的cuda-xx.x文件夹仍然在,需要手动删除。

所以如果自己要卸载的cuda没有配置cudnn,那么cuda-xx.x文件夹在卸载完成后会被自动删除,也就没必要再运行最后一句了

本次安装11.8,为了稳定

非常重要,如何正确安装CUDA,一定要严格按照这个博客步骤!!

这个博客安装cuda步骤也是一样,可以结合着看

按照上述第1个博客的步骤,要选择下图中的配置进行安装,特别注意Install Type

❌ 如果选择deb(local),则会自动安装所下载cuda的显卡驱动,导致以安装的显卡驱动和自动下载的显卡驱动冲突,导致以后安装pytorch识别不了cuda,以及各种问题

✔️ 选择 runfile(local),可以手动选择是否安装显卡驱动,解决问题

在这里插入图片描述

安装命令行

wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run

sudo sh cuda_11.8.0_520.61.05_linux.run

安装时,仍会提示目标CUDA toolkit对应版本的显卡驱动未被发现,推荐我们安装其版本的显卡驱动,这时我们键入continue,再键入accept同意用户协议,然后将光标移动到driver处,键入回车,以取消对驱动的安装:其他的保持不动,选择“Install”,稍等几分钟就装好了

在这里插入图片描述

在这里插入图片描述

出现下面界面,则安装成功

在这里插入图片描述

添加环境变量

此步参考这个博客

echo 'export PATH=/usr/local/cuda-11.8/bin:$PATH' >> ~/.bashrc

echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc

source ~/.bashrc

检查cuda版本

nvcc -V

在这里插入图片描述

再次检查显卡驱动是否正常

nvidia-smi

在这里插入图片描述

----------不要看下面的-----------

暂时安装12.1 版本的CUDA,想装11.7或11.8都不行,放弃

为什么是12.1,发现pytorch官网有12.1安装pytorch的命令行

12.1官网

在这里插入图片描述

按照下面给的命令行一行一行安装

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin

sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600

wget https://developer.download.nvidia.com/compute/cuda/12.1.0/local_installers/cuda-repo-ubuntu2004-12-1-local_12.1.0-530.30.02-1_amd64.deb

sudo dpkg -i cuda-repo-ubuntu2004-12-1-local_12.1.0-530.30.02-1_amd64.deb

sudo cp /var/cuda-repo-ubuntu2004-12-1-local/cuda-*-keyring.gpg /usr/share/keyrings/

sudo apt-get update

sudo apt-get -y install cuda

添加环境变量

echo 'export PATH=/usr/local/cuda-12.1/bin:$PATH' >> ~/.bashrc

echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc

source ~/.bashrc

----------不要看上面的-----------

5. 安装miniconda

安装miniconda3教程

安装路径 /home/miniconda3

最后一步环境变量配置改为下面:

echo 'export PATH="/home/miniconda3/bin:$PATH"'>> ~/.bashrc

source ~/.bashrc

在这里插入图片描述

conda如何创建和删除环境

创建环境

conda create -n pytorch_gpu python=3.8

删除环境

conda remove -n pytorch_gpu --all

# 必须要加all

进入环境

(1)先进入base环境

# 进入base环境

source activate

# 退出环境

source deactivate

(2)进入自己的环境

conda activate pytorch_gpu

(2.5)上面进入base环境,再进入自己的环境可以合并成一个命令

source activate pytorch_gpu

6. 安装cudnn

首先进入自己的环境中

然后进入官网,下载对应的版本

cudnn官网下载地址

暂时选择11.x 中 第2个下载选择,Linux_x86_64(Tar)

在这里插入图片描述

注意下载完后将文件复制到电脑的home文件夹下

在这里插入图片描述

如何解压各种形式的文件

解压

tar -xf cudnn-linux-x86_64-8.9.6.50_cuda11-archive.tar.xz

进入文件夹

cd cudnn-linux-x86_64-8.9.6.50_cuda11-archive/

执行下面两个命令,复制文件

sudo cp -d -r ./lib/* /usr/local/cuda-11.8/lib64/

sudo cp -r ./include/* /usr/local/cuda-11.8/include/

赋予权限

sudo chmod a+r /usr/local/cuda-11.8/include/cudnn.h /usr/local/cuda-11.8/lib64/libcudnn*

查看信息

cat /usr/local/cuda-11.8/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

在这里插入图片描述

好像成功

从这开始先去安装pytorch

7. 安装pytorch

就按照官网的给的命令安装就行,不用conda,conda慢,用pip3,快

pytorch官网

命令,本机cuda11.8对应的pytorch

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

在这里插入图片描述

验证pytorch是否安装成功

python

import torch

from torch.backends import cudnn

print(cudnn.is_available())

print(torch.backends.cudnn.version())

torch.cuda.is_available()

# True,则gpu版本的pytorch安装成功

torch.zeros(1).cuda()

结果,成功了

在这里插入图片描述

在这里插入图片描述


关于conda、pip换源安装pytorch,可以参考下面的博客,以防万一

ubuntu20.04 更换conda,pip源并下载pytorch


-----------------不用看下面的离线安装------------

如果哪天需要离线安装,可以参考下面的博客

ubuntu安装pytorch的CPU版本GPU版本,分conda安装和pip安装,以及whl离线安装pytorch

pytorch离线下载列表

torchvision离线下载列表

选择紫色的cu121

在这里插入图片描述


8. 所有都安装成功,验证cuda,pytorch,cudnn

python

import torch

from torch.backends import cudnn

print(cudnn.is_available())

print(torch.backends.cudnn.version())

torch.cuda.is_available()

# True,则gpu版本的pytorch安装成功

torch.zeros(1).cuda()

在这里插入图片描述

9. 安装编辑器,如pycharm

安装pycharm

10. 其他参考博客

安装搜狗输入法和截图程序

这个也挺好的,Ububtu20.04 CUDA安装与环境配置、CUDNN安装

【看看怎么卸载】 ubuntu20.04 显卡驱动,CUDA 安装和卸载,cudnn安装

pip换源与conda换源

pip临时和永久换源


pip3 install scikit-learn -i https://pypi.tuna.tsinghua.edu.cn/simple


不要加 --user 否则会安装到全局

安装cv2

pip3 install opencv-python -i https://pypi.tuna.tsinghua.edu.cn/simple



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。