Ubuntu22.04_AI环境部署_CUDA_cuDNN9_cuDNN8
JunFaimec 2024-08-10 09:01:02 阅读 82
Ubuntu22.04_AI环境部署手册v_2.0
Prerequisites环境步骤如下:1. 系统准备2.安装CUDA3. 安装cuDNN3.1下载cuDNN压缩包(version<=9.0.0.0,即version8)3.2deb文件配置(version>=9.0.0.0)3.3刷新库3.4 安装代码样例和官方文档3.5 安装运行库3.6 安装扩展库3.7更新库3.8验证cuDNN安装是否成功3.8.1方法一(mnistCUDNN):3.8.1.1 切换目录并进行测试3.8.1.2 如果遇到缺少FreeImage.h3.8.1.3 安装:3.8.1.4 运行:
3.8.2 方法二:烟雾测试(smoke)3.8.2.1 下载依赖3.8.2.2创建虚拟环境3.8.2.3激活环境3.8.2.4安装pytorch以及内核3.8.2.5安装依赖库确保make3.8.2.6 运行烟雾测试
3.9使用nvidia-smi查看GPU使用情况
4 如何删除CUDA和cDNN欢迎大家留言讨论!
Prerequisites
注意:以下cd的路径文件,请切换到自己文件系统的目录下进行!!!
<code>查看**版本链条**,要确保自己的各个环节版本是适配的:
**nvidia + nvidia-driver + cuda + cuda-toolkit + cudnn + gcc + kernel + pytorch + python**
以下版本号来自官网,更新于2024.5.27
环境
在本计算机下,使用的环境如下;
经过官网的版本对齐后,需要安装cuDNN9;
环境 | 版本号 |
---|---|
GPU版本 | NVIDIA GeForce GTX 1650 |
系统版本 | ubuntu 22.04 |
CUDA版本 | CUDA 12.2 |
cuDNN版本 | cuDNN 9.1.1.1 |
步骤如下:
1. 系统准备
更新系统
<code>sudo apt update && sudo apt upgrade -y
安装基础依赖包
sudo apt install git curl vim build-essential gcc-9 g++-9 python-is-python3 python3-virtualenv
软件&更新
Go to “Software & Updates” then select the “Additional Drivers” tab;
进入如下界面,选择最新版本的(专有,tested)即可;
2.安装CUDA
下载CUDA安装包,最好copy到home:
<code>wget https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda_12.2.2_535.104.05_linux.run
安装CUDA
sudo sh cuda_12.2.2_535.104.05_linux.run
配置环境变量 ,source ~/.bashrc 或者 source ~/.zshrc文件中,在末尾填写以下字段:
export PATH=/usr/local/cuda-12.2/bin${ PATH:+:${ PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
测试CUDA安装,>cuda11.6版本在安装时不提供samples,需要去到github上面下载
https://github.com/NVIDIA/cuda-samples
下载完成后,输入以下,并运行:
注意:切换到该文件所在目录下运行!
cd cuda-samples/Samples/1_Utilities/deviceQuery
make all
make run
出现以下格式的输出,即为正确:
<code>deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 12.2, CUDA Runtime Version = 12.2, NumDevs = 1
Result = PASS
查看下载好的cuda版本
nvcc -V
3. 安装cuDNN
3.1下载cuDNN压缩包(version<=9.0.0.0,即version8)
解压并复制文件到CUDA目录
tar -zvxf cudnn-11.2-linux-x64-v8.1.1.33.tgz
sudo cp -P cuda/include/cudnn.h /usr/local/cuda-11.2/include
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda-11.2/lib64/
sudo chmod a+r /usr/local/cuda-11.2/lib64/libcudnn*
以上适用于v8的cuDNN,通过下载tar文件的方式配置环境变量
3.2deb文件配置(version>=9.0.0.0)
我们已经安装了显卡驱动程序和CUDA;
如果系统还没有安装zlib包,可先sudo apt-get install zlib1g
安装一下;
以下为下载代码:
获取软件包:
wget https://developer.download.nvidia.com/compute/cudnn/9.1.1/local_installers/cudnn-local-repo-ubuntu2204-9.1.1_1.0-1_amd64.deb
安装软件包
sudo dpkg -i cudnn-local-repo-ubuntu2204-9.1.1_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-ubuntu2204-9.1.1/cudnn-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cudnn9-cuda-12
3.3刷新库
sudo apt-get update
3.4 安装代码样例和官方文档
sudo apt-get -y install /var/cudnn-local-repo-ubuntu2204-9.1.1/libcudnn9-samples_9.1.1.17-1_all.deb
3.5 安装运行库
sudo apt-get -y install /var/cudnn-local-repo-ubuntu2204-9.1.1/cudnn9_9.1.1-1_amd64.deb
sudo apt-get -y install /var/cudnn-local-repo-ubuntu2204-9.1.1/cudnn9-cuda-12_9.1.1.17-1_amd64.deb
3.6 安装扩展库
sudo apt-get -y install /var/cudnn-local-repo-ubuntu2204-9.1.1/libcudnn9-dev-cuda-12_9.1.1.17-1_amd64.deb
3.7更新库
sudo apt-get update
3.8验证cuDNN安装是否成功
3.8.1方法一(mnistCUDNN):
3.8.1.1 切换目录并进行测试
cp -r /usr/src/cudnn_samples_v9/ $HOME
cd $HOME/cudnn_samples_v9/mnistCUDNN
make clean && make
3.8.1.2 如果遇到缺少FreeImage.h
3.8.1.3 安装:
sudo apt-get install libfreeimage3 libfreeimage-dev
3.8.1.4 运行:
./mnistCUDNN
出现以上即为成功
3.8.2 方法二:烟雾测试(smoke)
3.8.2.1 下载依赖
<code>sudo apt install build-essential pkg-config cmake cmake-qt-gui ninja-build valgrind
sudo apt install python3 python3-wheel python3-pip python3-venv python3-dev python3-setuptools
3.8.2.2创建虚拟环境
python3 -m venv ~/venv/torchgpu
3.8.2.3激活环境
source venv/torchgpu/bin/activate
3.8.2.4安装pytorch以及内核
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
pip install ipykernel
python -m ipykernel install --user --name TORCH-GPU --display-name "PyTorch GPU"
3.8.2.5安装依赖库确保make
sudo apt-get install freeglut3 freeglut3-dev
3.8.2.6 运行烟雾测试
cd cuda-samples/Samples/5_Domain_Specific/smokeParticles
make all
make run
3.9使用nvidia-smi查看GPU使用情况
<code>nvidia-smi
~~~~~~~~~~~~~~~~~~~~跟新于2024.5.28~~~~~~~~~~~~~~~~~~~~~~~~~~~
4 如何删除CUDA和cDNN
<code># remove删除cudnn头文件和库文件
sudo rm /usr/local/cuda-12.2/include/cudnn*.h
sudo rm /usr/local/cuda-12.2/lib64/libcudnn*
#有其他情况出现欢迎评论区留言
欢迎大家留言讨论!
声明
本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。