在这个快速发展的 AI 领域,GPU 已成为深度学习和机器学习任务中不可或缺的部分。本教程将介绍如何为您的机器设置 GPU,以便更好地进行机器学习。

系统要求

在安装 GPU 驱动之前,请确保您的系统满足以下要求:

  • 操作系统:Ubuntu 18.04 或更高版本
  • 硬件:兼容的 NVIDIA GPU(如 GeForce、Quadro 或 Tesla)

安装 NVIDIA 驱动

  1. 卸载旧驱动:首先,您需要卸载任何已安装的 NVIDIA 驱动。运行以下命令:
sudo apt-get remove --purge nvidia-* nvidia-gtk*
  1. 添加 NVIDIA 驱动 PPA:接着,添加 NVIDIA 驱动 PPA 到您的系统中。
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
  1. 安装 NVIDIA 驱动:安装最新的 NVIDIA 驱动。
sudo apt-get install nvidia-driver-<version>

请将 <version> 替换为您要安装的驱动版本。

  1. 验证安装:安装完成后,运行以下命令来验证驱动是否正确安装:
nvidia-smi

您应该看到类似于以下输出的信息:

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.32.03    Driver Version: 460.32.03    CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce RTX 3080 Ti  Off  | 00000000:1E:00.0 Off |                    0 |
| N/A   31C    P0    28W / 350W |      0MiB / 11935MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

安装 CUDA Toolkit

NVIDIA CUDA Toolkit 是用于开发高性能计算应用程序的软件平台。以下是安装 CUDA Toolkit 的步骤:

  1. 下载 CUDA Toolkit:从 NVIDIA 官网 下载适合您系统的 CUDA Toolkit。

  2. 安装 CUDA Toolkit:解压下载的文件,并运行以下命令进行安装:

sudo ./cuda_11.2.2_460.32.03_linux.run

请确保在安装过程中选择正确的安装路径。

  1. 验证安装:安装完成后,打开终端并运行以下命令来验证 CUDA Toolkit 是否正确安装:
nvcc --version

您应该看到类似于以下输出的信息:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2021 NVIDIA Corporation
Built on <日期>
Cuda compilation tools, release <版本号>, V<版本号>

安装 cuDNN

cuDNN 是 NVIDIA 提供的深度神经网络加速库。以下是安装 cuDNN 的步骤:

  1. 下载 cuDNN:从 NVIDIA 官网 下载适合您系统的 cuDNN。

  2. 解压 cuDNN:解压下载的 cuDNN 文件。

  3. 复制 cuDNN 文件:将解压后的 cuDNN 文件复制到 CUDA Toolkit 的安装目录下。

  4. 设置环境变量:在您的 .bashrc 文件中添加以下行:

export LD_LIBRARY_PATH=/usr/local/cuda/extras/CUPTI/lib64:$LD_LIBRARY_PATH
  1. 验证安装:重新打开终端并运行以下命令来验证 cuDNN 是否正确安装:
nvcc --version

您应该看到类似于以下输出的信息:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2021 NVIDIA Corporation
Built on <日期>
Cuda compilation tools, release <版本号>, V<版本号>

总结

通过以上步骤,您已经成功为您的机器设置了 GPU,并安装了 CUDA Toolkit 和 cuDNN。现在,您可以开始使用 GPU 进行深度学习和机器学习任务了。

NVIDIA GPU