Ubuntu下的CUDA环境的安装与配置

一步步走 2024-10-25 08:37:01 阅读 78

经常要在Ubuntu上配置CUDA的运行环境，这里记录下避免之后忘记。

在 Ubuntu 上配置 CUDA 环境，通常需要以下几个步骤：

检查系统需求和安装前的准备安装 NVIDIA 驱动安装 CUDA 工具包配置环境变量验证 CUDA 安装（可选）安装 cuDNN（用于深度学习）

1. 检查系统需求和准备工作

在安装 CUDA 之前，确保以下事项：

你使用的 Ubuntu 版本支持 CUDA。可以查看 NVIDIA CUDA 官方文档获取兼容的操作系统列表。NVIDIA 显卡支持 CUDA（一般来说，较新的 NVIDIA 显卡都支持）。

建议你先删除任何旧版本的驱动程序或 CUDA 软件包，以避免冲突：

<code>sudo apt-get --purge remove "*nvidia*"

2. 安装 NVIDIA 驱动

你可以使用 Ubuntu 的包管理器来自动安装适合的 NVIDIA 驱动。

首先，更新系统软件包：

sudo apt update sudo apt upgrade

启用 Ubuntu 的驱动程序仓库：

sudo add-apt-repository ppa:graphics-drivers/ppa sudo apt update

检查可用的 NVIDIA 驱动：

ubuntu-drivers devices

这将列出系统支持的 NVIDIA 驱动版本。

安装推荐的 NVIDIA 驱动程序（例如 nvidia-driver-xxx，其中 xxx 是版本号）：

sudo apt install nvidia-driver-xxx

例如，如果推荐安装 nvidia-driver-470，则命令为：

sudo apt install nvidia-driver-470

安装完成后，重新启动计算机：

sudo reboot

3. 安装 CUDA 工具包

下载 CUDA 工具包：访问 NVIDIA CUDA Toolkit 下载页面，选择你的 Ubuntu 版本并复制对应的安装命令。以 CUDA 12.0 为例，使用以下步骤：

添加 CUDA 存储库和 GPG 密钥：根据官网提供的命令，运行以下命令来添加 CUDA 存储库：

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin

sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600

添加 GPG 密钥：

sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/7fa2af80.pub

安装 CUDA：安装完 GPG 密钥后，添加 CUDA 存储库并安装 CUDA 工具包：

sudo apt update sudo apt install cuda

重启系统：安装完成后，重新启动系统：

sudo reboot

4. 配置环境变量

为了让系统可以找到 CUDA 工具和库，需要配置环境变量。

打开终端，编辑 .bashrc 文件：

nano ~/.bashrc

在文件的末尾添加以下几行（请根据实际安装路径调整，通常路径是 /usr/local/cuda-<version>）：

export PATH=/usr/local/cuda/bin:$PATH export

LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

保存并关闭文件，然后使更改生效：

source ~/.bashrc

5. 验证 CUDA 安装

检查 CUDA 版本：使用以下命令来验证 CUDA 是否安装成功：

nvcc --version

你应该看到类似以下的输出，显示 CUDA 版本信息：

nvcc: NVIDIA (R) Cuda compiler driver

Built on Thu_May_25_19:08:35_PDT_2023

Cuda compilation tools, release 12.0, V12.0.194

运行示例代码： CUDA 工具包中通常包含示例代码，可以使用这些示例来测试是否成功安装。

先导航到 CUDA 安装目录的示例文件夹：

cd /usr/local/cuda/samples/1_Utilities/deviceQuery

然后编译并运行 deviceQuery：

sudo make ./deviceQuery

如果输出显示 GPU 设备的详细信息，说明安装成功。

示例输出：

./deviceQuery Starting...

CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce GTX 1050"

CUDA Driver Version / Runtime Version 11.0 / 11.0

Total amount of global memory: 4041 MBytes (4235358208 bytes)

(6) Multiprocessors, (128) CUDA Cores/MP: 768 CUDA Cores

6. （可选）安装 cuDNN

cuDNN 是 NVIDIA 的深度学习加速库。如果你计划在 GPU 上运行深度学习框架（如 TensorFlow、PyTorch），建议安装 cuDNN。

下载 cuDNN：从 NVIDIA 官网 cuDNN 下载页面下载与你的 CUDA 版本匹配的 cuDNN。

解压并安装：下载的文件是 .tar 格式。解压后，将 cuDNN 文件复制到 CUDA 目录中：

tar -xzvf cudnn-<version>-linux-x64-v<version>.tgz

sudo cp cuda/include/cudnn*.h /usr/local/cuda/include

sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64

sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

验证 cuDNN 安装：检查 cuDNN 版本：

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

如果输出了版本号，说明 cuDNN 安装成功。

总结

安装 NVIDIA 驱动：确保显卡驱动正确安装。安装 CUDA 工具包：下载并配置好 CUDA 工具包。配置环境变量：设置 CUDA 的 PATH 和 LD_LIBRARY_PATH。验证安装：使用 nvcc 和示例代码来验证安装是否成功。

上一篇： Win11安装基于WSL2的Ubuntu

下一篇：记录在飞牛NAS系统中通过Docker搭建并配置Linux版本XAMPP镜像环境[图文]

本文标签

Ubuntu下的CUDA环境的安装与配置

声明

本文内容仅代表作者观点，或转载于其他网站，本站不以此文作为商业用途
如有涉及侵权，请联系本站进行删除
转载本站原创文章，请注明来源及作者。