Ubuntu22.04_AI环境部署_CUDA_cuDNN9_cuDNN8

JunFaimec 2024-08-10 09:01:02 阅读 82

Ubuntu22.04_AI环境部署手册v_2.0

Prerequisites环境步骤如下:1. 系统准备2.安装CUDA3. 安装cuDNN3.1下载cuDNN压缩包(version<=9.0.0.0,即version8)3.2deb文件配置(version>=9.0.0.0)3.3刷新库3.4 安装代码样例和官方文档3.5 安装运行库3.6 安装扩展库3.7更新库3.8验证cuDNN安装是否成功3.8.1方法一(mnistCUDNN):3.8.1.1 切换目录并进行测试3.8.1.2 如果遇到缺少FreeImage.h3.8.1.3 安装:3.8.1.4 运行:

3.8.2 方法二:烟雾测试(smoke)3.8.2.1 下载依赖3.8.2.2创建虚拟环境3.8.2.3激活环境3.8.2.4安装pytorch以及内核3.8.2.5安装依赖库确保make3.8.2.6 运行烟雾测试

3.9使用nvidia-smi查看GPU使用情况

4 如何删除CUDA和cDNN欢迎大家留言讨论!

Prerequisites

注意:以下cd的路径文件,请切换到自己文件系统的目录下进行!!!

<code>查看**版本链条**,要确保自己的各个环节版本是适配的:

**nvidia + nvidia-driver + cuda + cuda-toolkit + cudnn + gcc + kernel + pytorch + python**

以下版本号来自官网,更新于2024.5.27

驱动和CUDA兼容版本表1

驱动和CUDA兼容版本表2

环境

在本计算机下,使用的环境如下;

经过官网的版本对齐后,需要安装cuDNN9;

环境 版本号
GPU版本 NVIDIA GeForce GTX 1650
系统版本 ubuntu 22.04
CUDA版本 CUDA 12.2
cuDNN版本 cuDNN 9.1.1.1

步骤如下:

1. 系统准备

更新系统

<code>sudo apt update && sudo apt upgrade -y

安装基础依赖包

sudo apt install git curl vim build-essential gcc-9 g++-9 python-is-python3 python3-virtualenv

软件&更新

Go to “Software & Updates” then select the “Additional Drivers” tab;

进入如下界面,选择最新版本的(专有,tested)即可;

在这里插入图片描述

2.安装CUDA

下载CUDA安装包,最好copy到home:

<code>wget https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda_12.2.2_535.104.05_linux.run

安装CUDA

sudo sh cuda_12.2.2_535.104.05_linux.run

配置环境变量 ,source ~/.bashrc 或者 source ~/.zshrc文件中,在末尾填写以下字段:

export PATH=/usr/local/cuda-12.2/bin${ PATH:+:${ PATH}}

export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

export CUDA_HOME=/usr/local/cuda

export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

测试CUDA安装,>cuda11.6版本在安装时不提供samples,需要去到github上面下载

https://github.com/NVIDIA/cuda-samples

下载完成后,输入以下,并运行:

注意:切换到该文件所在目录下运行!

cd cuda-samples/Samples/1_Utilities/deviceQuery

make all

make run

在这里插入图片描述

出现以下格式的输出,即为正确:

<code>deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 12.2, CUDA Runtime Version = 12.2, NumDevs = 1

Result = PASS

查看下载好的cuda版本

nvcc -V

3. 安装cuDNN

3.1下载cuDNN压缩包(version<=9.0.0.0,即version8)

解压并复制文件到CUDA目录

tar -zvxf cudnn-11.2-linux-x64-v8.1.1.33.tgz

sudo cp -P cuda/include/cudnn.h /usr/local/cuda-11.2/include

sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda-11.2/lib64/

sudo chmod a+r /usr/local/cuda-11.2/lib64/libcudnn*

以上适用于v8的cuDNN,通过下载tar文件的方式配置环境变量

3.2deb文件配置(version>=9.0.0.0)

我们已经安装了显卡驱动程序和CUDA;

如果系统还没有安装zlib包,可先sudo apt-get install zlib1g安装一下;

以下为下载代码:

获取软件包:

wget https://developer.download.nvidia.com/compute/cudnn/9.1.1/local_installers/cudnn-local-repo-ubuntu2204-9.1.1_1.0-1_amd64.deb

安装软件包

sudo dpkg -i cudnn-local-repo-ubuntu2204-9.1.1_1.0-1_amd64.deb

sudo cp /var/cudnn-local-repo-ubuntu2204-9.1.1/cudnn-*-keyring.gpg /usr/share/keyrings/

sudo apt-get update

sudo apt-get -y install cudnn9-cuda-12

3.3刷新库

sudo apt-get update

3.4 安装代码样例和官方文档

sudo apt-get -y install /var/cudnn-local-repo-ubuntu2204-9.1.1/libcudnn9-samples_9.1.1.17-1_all.deb

3.5 安装运行库

sudo apt-get -y install /var/cudnn-local-repo-ubuntu2204-9.1.1/cudnn9_9.1.1-1_amd64.deb

sudo apt-get -y install /var/cudnn-local-repo-ubuntu2204-9.1.1/cudnn9-cuda-12_9.1.1.17-1_amd64.deb

3.6 安装扩展库

sudo apt-get -y install /var/cudnn-local-repo-ubuntu2204-9.1.1/libcudnn9-dev-cuda-12_9.1.1.17-1_amd64.deb

3.7更新库

sudo apt-get update

3.8验证cuDNN安装是否成功

3.8.1方法一(mnistCUDNN):
3.8.1.1 切换目录并进行测试

cp -r /usr/src/cudnn_samples_v9/ $HOME

cd $HOME/cudnn_samples_v9/mnistCUDNN

make clean && make

3.8.1.2 如果遇到缺少FreeImage.h
3.8.1.3 安装:

sudo apt-get install libfreeimage3 libfreeimage-dev

3.8.1.4 运行:

./mnistCUDNN

在这里插入图片描述

出现以上即为成功

3.8.2 方法二:烟雾测试(smoke)
3.8.2.1 下载依赖

<code>sudo apt install build-essential pkg-config cmake cmake-qt-gui ninja-build valgrind

sudo apt install python3 python3-wheel python3-pip python3-venv python3-dev python3-setuptools

3.8.2.2创建虚拟环境

python3 -m venv ~/venv/torchgpu

3.8.2.3激活环境

source venv/torchgpu/bin/activate

3.8.2.4安装pytorch以及内核

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113

pip install ipykernel

python -m ipykernel install --user --name TORCH-GPU --display-name "PyTorch GPU"

3.8.2.5安装依赖库确保make

sudo apt-get install freeglut3 freeglut3-dev

3.8.2.6 运行烟雾测试

cd cuda-samples/Samples/5_Domain_Specific/smokeParticles

make all

make run

在这里插入图片描述

3.9使用nvidia-smi查看GPU使用情况

<code>nvidia-smi

在这里插入图片描述

~~~~~~~~~~~~~~~~~~~~跟新于2024.5.28~~~~~~~~~~~~~~~~~~~~~~~~~~~

4 如何删除CUDA和cDNN

<code># remove删除cudnn头文件和库文件

sudo rm /usr/local/cuda-12.2/include/cudnn*.h

sudo rm /usr/local/cuda-12.2/lib64/libcudnn*

#有其他情况出现欢迎评论区留言

欢迎大家留言讨论!



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。