多版本cuda安装
[TOC]
cuda的下载与安装
- 第1步,确认操作系统的信息,以便安装对应的cuda驱动,示例为 Ubuntu 22.04.2 x86_64、内核为 5.15.0
[root@ubuntu ~]# cat /etc/issue
Ubuntu 22.04.2 LTS \n \l
[root@ubuntu ~]# uname -a
Linux ubuntu 5.15.0-100-generic #110-Ubuntu SMP Wed Feb 7 13:27:48 UTC 2024 x86_64 x86_64 x86_64 GNU/Linux
- 第2步,打开 CUDA Toolkit 官网,选择与linux内核版本一致的CUDA版本,比如 Ubuntu 22.04 基于内核 5.15.0 的cuda版本文件为
cuda_11.7.0_515.43.04_linux.run
#.选择过程
Operating System : Linux
Architecture : x86_64
Distribution : Ubuntu
Version : 22.04
Installer Type : runfile(local)
#.建议选择与lniux内核版本一致的CUDA驱动
Ubuntu 22.04 内核 : 5.15.0-100-generic
CUDA Toolkit 版本 : CUDA Toolkit 11.7
CUDA 驱动文件名称 : cuda_11.7.0_515.43.04_linux.run
- 第3步,拷贝上一步生成的下载地址,去目标服务器上安装
cd /opt/
wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run
sh cuda_11.7.0_515.43.04_linux.run
nvidia显卡驱动的下载与安装
- 第1步,确认操作系统及CUDA的信息,以便安装对应的显卡驱动,示例为 Ubuntu 22.04、CUDA版本为 11.7
[root@ubuntu ~]# cat /etc/issue
Ubuntu 22.04.2 LTS \n \l
[root@ubuntu ~]# nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Tue_May__3_18:49:52_PDT_2022
Cuda compilation tools, release 11.7, V11.7.64
Build cuda_11.7.r11.7/compiler.31294372_0
- 第2步,打开 nvidia官网,选择与CUDA版本一致的显卡驱动,比如 NVIDIA Tesla T4 基于 CUDA 11.7 的驱动文件为 NVIDIA-Linux-x86_64-515.105.01.run
注:更多 CUDA Toolkit 与 NVIDIA Driver 的版本对应信息可参考 cuda-toolkit-release-notes
产品类型 : Tesla
产品系列 : T-Series
产品家族 : Tesla T4
操作系统 : Linux 64-bit
CUDA Toolkit : 11.7
语言 : Chinese (Simplified)
#.选择与CUDA版本一致的显卡驱动
CUDA Toolkit : 11.7
版本 : 515.105.01
发布日期 : 2023.3.30
文件名称 : NVIDIA-Linux-x86_64-515.105.01.run
文件大小 : 346.89 MB
- 第3步,拷贝上一步生成的下载地址,去目标服务器上安装
cd /opt/
wget https://cn.download.nvidia.cn/tesla/515.105.01/NVIDIA-Linux-x86_64-515.105.01.run
sh ./NVIDIA-Linux-x86_64-515.105.01.run -s -no-nouveau-check
- 第4步,确认 nvidia 显卡信息
[root@ubuntu ~]# nvidia-smi
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 515.105.01 Driver Version: 515.105.01 CUDA Version: 11.7 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 Tesla T4 Off | 00000000:01:00.0 Off | 0 |
| N/A 45C P0 26W / 70W | 2MiB / 15360MiB | 4% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
多版本cuda配置
- 假设先装了 cuda-11.7 后装了 cuda-12.0,但是
nvcc --version
看到的cuda版本仍为 11.7,现在需要使用 cuda 12.0 这个版本
[root@ubuntu ~]# sh cuda_11.7.0_515.43.04_linux.run
[root@ubuntu ~]# sh cuda_12.0.0_525.60.13_linux.run
[root@ubuntu ~]# ll /usr/local/
lrwxrwxrwx 1 root root 21 Jun 18 03:33 cuda -> /usr/local/cuda-11.7//
drwxr-xr-x 15 root root 4096 Jun 18 03:33 cuda-11.7/
drwxr-xr-x 17 root root 4096 Oct 10 2023 cuda-12.0/
[root@ubuntu ~]# echo $PATH
/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin:/usr/local/cuda-11.7/bin
[root@ubuntu ~]# nvcc --version | grep release
Cuda compilation tools, release 11.7, V11.7.64
- 修改环境变量
$PATH
将 cuda-11.7 替换为 cuda-12.0,过程如下:
[root@ubuntu ~]# PATH=`echo $PATH | sed "s/cuda-11.7/cuda-12.0/"`
[root@ubuntu ~]# echo $PATH
/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin:/usr/local/cuda-12.0/bin
[root@ubuntu ~]# nvcc --version | grep release
Cuda compilation tools, release 12.0, V12.0.76