Ubuntu 20.04安装显卡驱动、CUDA、Pytorch(2024.06最新)

大白很火 2024-07-02 14:37:04 阅读 82

文章目录

一、安装显卡驱动1.1 查看显卡型号1.2 根据显卡型号选择驱动1.3 获取下载链接1.4 查看下载的显卡驱动安装文件1.5 更新软件列表和安装必要软件、依赖1.6 卸载原有驱动1.7 禁用默认驱动1.8 安装lightdm显示管理器1.9 停止显示服务器1.10 在文本界面中,禁用X-window服务1.11 安装驱动1.12 检测显卡驱动是否安装成功1.12 重启显示服务、恢复图像界面

二、安装CUDA2.1 选择合适的CUDA版本2.2 下载CUDA2.3 安装CUDA2.4 环境变量配置2.5 检测CUDA是否安装成功

三、安装Pytorch3.1 选择合适Pytorch版本3.2 安装Pytorch

四、关于安装cuDNN(这个坑以后再补)

一、安装显卡驱动

1.1 查看显卡型号

lspci | grep -i nvidia

在这里插入图片描述

我们发现输出的信息中有Device 2230,可以根据这个信息查询显卡型号

查询网址:https://admin.pci-ids.ucw.cz/mods/PC/10de?action=help?help=pci

在这里插入图片描述

输入后点击Jump查询

在这里插入图片描述

我们发现显卡型号为RTX A6000

1.2 根据显卡型号选择驱动

英伟达驱动下载:https://www.nvidia.cn/Download/Find.aspx?lang=cn&QNF=1

根据需求,输入显卡型号操作系统语言,选择相应的驱动版本,我选择550.78这个版本。

在这里插入图片描述

1.3 获取下载链接

点击下载

在这里插入图片描述

点击【同意并开始下载

在这里插入图片描述

复制下载链接:https://cn.download.nvidia.cn/XFree86/Linux-x86_64/550.78/NVIDIA-Linux-x86_64-550.78.run

并使用wget在命令行下载:

wget https://cn.download.nvidia.cn/XFree86/Linux-x86_64/550.78/NVIDIA-Linux-x86_64-550.78.run

在这里插入图片描述

1.4 查看下载的显卡驱动安装文件

ll

在这里插入图片描述

1.5 更新软件列表和安装必要软件、依赖

sudo apt-get update

sudo apt-get install g++

sudo apt-get install gcc

sudo apt-get install make

1.6 卸载原有驱动

sudo apt-get remove --purge nvidia*

1.7 禁用默认驱动

在安装NVIDIA驱动前,禁用系统自带显卡驱动nouveau

使用vim打开和修改文件,也可用gedit

sudo vim /etc/modprobe.d/blacklist.conf

在文件尾增加两行:

blacklist nouveau

options nouveau modeset=0

在这里插入图片描述

更新文件

sudo update-initramfs –u

此时必须重启电脑:

sudo reboot

1.8 安装lightdm显示管理器

sudo apt-get install lightdm

1.9 停止显示服务器

sudo telinit 3

1.10 在文本界面中,禁用X-window服务

sudo service gdm3 stop

1.11 安装驱动

# 授予执行权限

sudo chmod 777 NVIDIA-Linux-x86_64-550.78.run

# 执行安装命令

sudo ./NVIDIA-Linux-x86_64-550.78.run

1.12 检测显卡驱动是否安装成功

nvidia-smi

在这里插入图片描述

大功告成~

1.12 重启显示服务、恢复图像界面

sudo service gdm3 start

sudo telinit 5

二、安装CUDA

2.1 选择合适的CUDA版本

我显卡的驱动版本是550.78,可以安装CUDA 12版本。可根据自己显卡版本选择合适的CUDA版本:查询链接:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

在这里插入图片描述

2.2 下载CUDA

下载页面链接:https://developer.nvidia.com/cuda-toolkit-archive

在这里插入图片描述

在这里插入图片描述

# 使用命令下载文件:

wget https://developer.download.nvidia.com/compute/cuda/12.1.0/local_installers/cuda_12.1.0_530.30.02_linux.run

在这里插入图片描述

# 使用命令查看文件下载:

ll

在这里插入图片描述

2.3 安装CUDA

sudo sh cuda_12.1.0_530.30.02_linux.run

稍等一会,会出现如下界面,输入:accept即可安装

在这里插入图片描述

接着会出现如下界面:

在这里插入图片描述

需要注意的是,上述过程我们已在步骤1安装显卡驱动,已无需再装,可通过键盘选择,取消驱动的安装。

再将光标通过键盘移至Install,开始安装:

在这里插入图片描述

2.4 环境变量配置

vim方式打开配置文件

sudo vim ~/.bashrc

在文件尾中加入以下两行:

export PATH="/usr/local/cuda-12.1/bin:$PATH"

export LD_LIBRARY_PATH="/usr/local/cuda-12.1/lib64:$LD_LIBRARY_PATH"

在这里插入图片描述

更新环境变量

source ~/.bashrc

2.5 检测CUDA是否安装成功

nvcc -V

在这里插入图片描述

命令行显示如上信息,表明安装成功!大功告成~

三、安装Pytorch

3.1 选择合适Pytorch版本

链接:https://pytorch.org/get-started/previous-versions/

在这里插入图片描述

由于CUDA安装的版本是12.1,所以可以用Pytorch的v2.2.0版本

3.2 安装Pytorch

可用conda安装

conda install pytorch==2.2.0 torchvision==0.17.0 torchaudio==2.2.0 pytorch-cuda=12.1 -c pytorch -c nvidia

也可用pip安装

pip install torch==2.2.0 torchvision==0.17.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cu121

四、关于安装cuDNN(这个坑以后再补)

cuDNN是一个基于CUDA的深度学习GPU加速库,可以提高深度学习模型在GPU上的训练速度。cuDNN不是必须安装的,但是一般会采用这个加速库。部分深度学习框架,如PyTorch,会自带预先编译的cuDNN,无需手动安装。后面我还需要安装Pytorch,所以cuDNN就没安装,需要安装的可以参考下面信息,但是不完整。

版本查看页面:https://developer.nvidia.com/cudnn-downloads

在这里插入图片描述

下载CUDA 12对应的cuDNN版本,这里我们选择8.9.0版本。点击该版本,显示如下,我们选择红框圈中的版本。

在这里插入图片描述



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。