多版本cuda安装

[TOC]

cuda的下载与安装

  • 第1步,确认操作系统的信息,以便安装对应的cuda驱动,示例为 Ubuntu 22.04.2 x86_64、内核为 5.15.0
[root@ubuntu ~]# cat /etc/issue
Ubuntu 22.04.2 LTS \n \l

[root@ubuntu ~]# uname -a
Linux ubuntu 5.15.0-100-generic #110-Ubuntu SMP Wed Feb 7 13:27:48 UTC 2024 x86_64 x86_64 x86_64 GNU/Linux
  • 第2步,打开 CUDA Toolkit 官网选择与linux内核版本一致的CUDA版本,比如 Ubuntu 22.04 基于内核 5.15.0 的cuda版本文件为 cuda_11.7.0_515.43.04_linux.run
#.选择过程
Operating System    :  Linux
Architecture        :  x86_64
Distribution        :  Ubuntu
Version             :  22.04
Installer Type      :  runfile(local)

#.建议选择与lniux内核版本一致的CUDA驱动
Ubuntu 22.04 内核   :  5.15.0-100-generic
CUDA Toolkit 版本   :  CUDA Toolkit 11.7
CUDA 驱动文件名称   :  cuda_11.7.0_515.43.04_linux.run
  • 第3步,拷贝上一步生成的下载地址,去目标服务器上安装
cd /opt/
wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run
sh cuda_11.7.0_515.43.04_linux.run

nvidia显卡驱动的下载与安装

  • 第1步,确认操作系统及CUDA的信息,以便安装对应的显卡驱动,示例为 Ubuntu 22.04、CUDA版本为 11.7
[root@ubuntu ~]# cat /etc/issue
Ubuntu 22.04.2 LTS \n \l

[root@ubuntu ~]# nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Tue_May__3_18:49:52_PDT_2022
Cuda compilation tools, release 11.7, V11.7.64
Build cuda_11.7.r11.7/compiler.31294372_0
  • 第2步,打开 nvidia官网选择与CUDA版本一致的显卡驱动,比如 NVIDIA Tesla T4 基于 CUDA 11.7 的驱动文件为 NVIDIA-Linux-x86_64-515.105.01.run

    注:更多 CUDA Toolkit 与 NVIDIA Driver 的版本对应信息可参考 cuda-toolkit-release-notes

产品类型        :   Tesla
产品系列        :   T-Series
产品家族        :   Tesla T4
操作系统        :   Linux 64-bit
CUDA Toolkit    :   11.7
语言            :   Chinese (Simplified)

#.选择与CUDA版本一致的显卡驱动
CUDA Toolkit    :   11.7
版本            :   515.105.01
发布日期        :   2023.3.30
文件名称        :   NVIDIA-Linux-x86_64-515.105.01.run
文件大小        :   346.89 MB
  • 第3步,拷贝上一步生成的下载地址,去目标服务器上安装
cd /opt/
wget https://cn.download.nvidia.cn/tesla/515.105.01/NVIDIA-Linux-x86_64-515.105.01.run
sh ./NVIDIA-Linux-x86_64-515.105.01.run -s -no-nouveau-check
  • 第4步,确认 nvidia 显卡信息
[root@ubuntu ~]# nvidia-smi
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 515.105.01   Driver Version: 515.105.01   CUDA Version: 11.7     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla T4            Off  | 00000000:01:00.0 Off |                    0 |
| N/A   45C    P0    26W /  70W |      2MiB / 15360MiB |      4%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

多版本cuda配置

  • 假设先装了 cuda-11.7 后装了 cuda-12.0,但是 nvcc --version 看到的cuda版本仍为 11.7,现在需要使用 cuda 12.0 这个版本
[root@ubuntu ~]# sh cuda_11.7.0_515.43.04_linux.run
[root@ubuntu ~]# sh cuda_12.0.0_525.60.13_linux.run

[root@ubuntu ~]# ll /usr/local/
lrwxrwxrwx  1 root root   21 Jun 18 03:33 cuda -> /usr/local/cuda-11.7//
drwxr-xr-x 15 root root 4096 Jun 18 03:33 cuda-11.7/
drwxr-xr-x 17 root root 4096 Oct 10  2023 cuda-12.0/

[root@ubuntu ~]# echo $PATH
/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin:/usr/local/cuda-11.7/bin

[root@ubuntu ~]# nvcc --version | grep release
Cuda compilation tools, release 11.7, V11.7.64
  • 修改环境变量 $PATH 将 cuda-11.7 替换为 cuda-12.0,过程如下:
[root@ubuntu ~]# PATH=`echo $PATH | sed "s/cuda-11.7/cuda-12.0/"`
[root@ubuntu ~]# echo $PATH
/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin:/usr/local/cuda-12.0/bin

[root@ubuntu ~]# nvcc --version | grep release
Cuda compilation tools, release 12.0, V12.0.76
Copyright © www.sqlfans.cn 2024 All Right Reserved更新时间: 2024-06-18 14:11:40

results matching ""

    No results matching ""