cuda和pytorch版本对应深度解析：版本匹配、环境搭建与常见问题

在深度学习领域，图形处理器（GPU）的并行计算能力是加速模型训练和推理的关键。NVIDIA的CUDA平台与PyTorch等深度学习框架的结合，使得研究人员和开发者能够高效地利用GPU资源。然而，要充分发挥这一协同效应，一个常常被忽视但极其重要的问题就是：CUDA与PyTorch的版本对应关系。

版本不匹配不仅会导致性能下降，更可能引发一系列恼人的错误，从简单的程序无法启动到复杂的运行时异常。本文将深入探讨这一核心议题，从“是什么”、“为什么”、“如何做”等多个角度，为您提供一份详尽、具体的操作指南，助您构建稳定高效的深度学习环境。

一、理解核心组件：它们“是什么”？

在讨论版本对应之前，我们首先需要明确涉及到的几个关键组件及其作用：

NVIDIA GPU 驱动

是什么： 这是操作系统与NVIDIA显卡之间进行通信的基础软件。它是所有CUDA应用程序能够正常运行的先决条件。

作用： 驱动程序提供了底层接口，允许CUDA Toolkit和应用程序访问GPU的硬件功能。CUDA Toolkit的运行对驱动版本有最低要求。
NVIDIA CUDA Toolkit (CUDA工具包)

是什么： CUDA是由NVIDIA推出的一种并行计算平台和编程模型，它允许开发者利用NVIDIA GPU的强大计算能力。CUDA工具包包含了编译器、库、调试器和文档等一系列开发工具。

作用： 它提供了在GPU上执行并行计算所需的一切，包括CUDA运行时库。例如，当PyTorch代码调用GPU操作时，它会通过CUDA运行时库与GPU通信。请注意，系统上可以安装多个CUDA工具包版本。
NVIDIA cuDNN (CUDA Deep Neural Network Library)

是什么： cuDNN是NVIDIA专门为深度神经网络设计的GPU加速库。它是一组高度优化的原始操作，用于执行卷积、池化、归一化和激活等常见的深度学习运算。

作用： cuDNN不是独立运行的，它依赖于特定的CUDA工具包版本。PyTorch等深度学习框架会调用cuDNN来加速其底层的神经网络计算。它的版本也需要与CUDA工具包以及深度学习框架兼容。
PyTorch

是什么： PyTorch是一个开源的机器学习库，广泛用于深度学习任务。它提供了张量计算（与NumPy类似）和基于GPU加速的深度神经网络功能。

作用： PyTorch通过其C++后端调用CUDA和cuDNN库来执行GPU上的数值计算和神经网络操作。PyTorch的二进制发行版会针对特定的CUDA版本进行编译，这意味着PyTorch本身包含了对某一特定CUDA版本库的依赖。
Python

是什么： 作为PyTorch的主要开发语言，Python及其版本管理对于环境的稳定性至关重要。Python环境中的各种包（包括PyTorch）需要协同工作。

作用： PyTorch作为一个Python包，其安装和运行都离不开Python解释器。不同版本的Python可能对某些PyTorch版本有兼容性要求。

二、为何版本匹配至关重要？

理解这些组件后，我们自然会问：“为什么版本匹配这么重要？” 答案在于它们之间的层层依赖关系。不匹配可能导致：

运行时错误与功能缺失

如果PyTorch期望的CUDA版本（它编译时所用的）与系统上实际可用的CUDA版本或驱动程序不兼容，您会遇到诸如CUDA error: no CUDA-capable device is detected、cuDNN_STATUS_ARCH_MISMATCH或更隐晦的性能下降等问题。某些高级功能（如FP16混合精度训练）可能因为cuDNN版本过旧而无法使用。
性能瓶颈

即使程序能够运行，一个不匹配的环境也可能无法充分利用GPU的潜力。例如，PyTorch可能回退到CPU执行某些操作，或者使用了未经最新优化的旧版CUDA/cuDNN库，导致训练时间显著增加。
复杂的故障排除

版本不匹配引发的问题往往难以诊断。错误信息可能模糊不清，耗费大量时间去排查和解决。
不稳定的开发环境

一个版本混乱的环境容易在升级或安装新库时引入新的问题，导致开发流程中断。

三、如何检查现有环境版本？

在着手安装或更新之前，了解您当前系统的各项版本至关重要。这能帮助您避免不必要的冲突和重复劳动。

检查NVIDIA GPU驱动版本

在Linux/Windows命令行中执行：
```
nvidia-smi
```
该命令会显示您的GPU型号、驱动版本（Driver Version）以及它支持的最高CUDA版本（CUDA Version）。请注意，nvidia-smi显示的CUDA版本是您的驱动程序能够支持的最高CUDA运行时API版本，而不是您系统上实际安装的CUDA Toolkit版本。
检查系统CUDA Toolkit版本

如果您已经安装了CUDA Toolkit，可以通过以下命令检查其版本：
```
nvcc --version
```
此命令输出的是您环境变量PATH中第一个nvcc工具的版本。如果未安装或未配置环境变量，此命令可能无法找到。

检查PyTorch使用的CUDA/cuDNN版本

在Python环境中执行：

import torch
print(f"PyTorch version: {torch.__version__}")
print(f"CUDA available: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"CUDA version used by PyTorch: {torch.version.cuda}")
    print(f"cuDNN version used by PyTorch: {torch.backends.cudnn.version()}")
    print(f"Number of GPUs: {torch.cuda.device_count()}")
    print(f"Current GPU name: {torch.cuda.get_device_name(0)}")

torch.version.cuda显示的是PyTorch二进制包编译时所依赖的CUDA版本。这与您系统上安装的CUDA Toolkit版本是两个概念。重要的是，您的NVIDIA驱动程序必须支持PyTorch编译时所依赖的这个CUDA版本。

检查Python版本

在命令行中执行：
```
python --version
```
或在Anaconda环境下：
```
conda list python
```

四、PyTorch与CUDA版本对应关系：查找与选择

“哪里可以找到兼容版本？我应该选择哪个？” 这是最核心的问题。PyTorch官方提供了明确的兼容性指南。

1. PyTorch官方安装页面：您的首选参考

访问PyTorch官方安装页面是查找最新兼容性信息的最佳途径。在该页面，您可以选择操作系统、包管理器（pip/conda）、Python版本、CUDA版本等，页面会动态生成对应的安装命令。

例如，如果您选择 “CUDA 11.8″，PyTorch会提供一个命令，如：

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

这里的cu118就明确指示了这个PyTorch包是针对CUDA 11.8编译的。

2. 理解“PyTorch编译时的CUDA版本”与“系统CUDA Toolkit版本”

这是一个常见的混淆点：

PyTorch编译时的CUDA版本 (torch.version.cuda)： 这指的是PyTorch二进制包在NVIDIA的服务器上编译时所使用的CUDA版本。例如，如果PyTorch包是针对CUDA 11.8编译的，那么它将包含针对CUDA 11.8 ABI（应用程序二进制接口）兼容的运行时库。
系统CUDA Toolkit版本 (nvcc --version)： 这是您自己机器上安装的CUDA开发工具包版本。这个工具包包含nvcc编译器、开发库等，用于您自己编译CUDA代码。

关键兼容性规则：

PyTorch通常向后兼容更旧的CUDA Toolkit运行时，并且可以向前兼容更新的NVIDIA驱动程序，只要该驱动程序支持PyTorch编译时所依赖的CUDA版本。

如果PyTorch是为CUDA 11.8编译的，那么它可以在一个安装了CUDA Toolkit 11.x（例如11.0到11.8）的系统上运行，也可以在一个安装了CUDA Toolkit 12.x的系统上运行，前提是您的NVIDIA驱动程序版本足够新，能够支持CUDA 11.8和您更高版本的CUDA Toolkit。

核心要求是：您的NVIDIA驱动程序必须能够支持PyTorch编译时所依赖的那个CUDA版本。nvidia-smi显示的CUDA版本为您系统驱动程序支持的最高CUDA版本。

推荐策略：

首先更新NVIDIA驱动程序到最新稳定版本。 这样可以确保您的驱动支持尽可能多的CUDA版本，为后续选择提供最大灵活性。
在PyTorch官网上选择一个与您的驱动器兼容的CUDA版本。 通常，选择一个较新的、但不是最新的CUDA版本（例如，如果最新是12.x，选择11.8或11.7）可以提供更好的稳定性，因为这些版本经过了更长时间的测试。
安装与PyTorch选择的CUDA版本相匹配的CUDA Toolkit。 尽管PyTorch可以兼容不同版本的系统CUDA Toolkit，但为了避免潜在问题，尽量保持一致或选择一个驱动支持范围内且版本较接近的CUDA Toolkit版本是一个好的实践。例如，如果PyTorch是针对cu118编译的，您可以安装CUDA Toolkit 11.8。

例如，如果nvidia-smi显示您的驱动支持CUDA 12.2，那么您可以放心地安装为CUDA 11.8或CUDA 12.1编译的PyTorch版本。但通常情况下，为了减少不确定性，选择与nvidia-smi显示接近或稍低于该值的CUDA版本来安装PyTorch是一个稳妥的选择。

3. 旧版本PyTorch与CUDA的兼容性

如果您需要使用旧版本的PyTorch（例如为了复现旧项目），可以在PyTorch历史版本页面查找具体的安装命令。这些命令通常会指明PyTorch与哪个CUDA版本配套。

例如，PyTorch 1.10.0可能提供了cu113和cu102版本，分别对应CUDA 11.3和CUDA 10.2。

五、详细安装步骤：从驱动到PyTorch

构建一个稳定高效的PyTorch深度学习环境需要按部就班。我们假设您正在从零开始或者需要彻底重建环境。

1. 更新或安装NVIDIA GPU驱动

这是第一步，也是最重要的一步。

Windows： 访问NVIDIA官方网站（https://www.nvidia.com/drivers），根据您的显卡型号和操作系统下载并安装最新稳定版的驱动程序。
Linux：
- 推荐方法 (Ubuntu为例)： 通过PPA (Personal Package Archive) 或官方仓库安装，这通常更稳定且易于维护。
```
sudo apt update
sudo apt upgrade
sudo apt autoremove
sudo apt install nvidia-driver-535 # 根据nvidia-smi或官网推荐选择版本
sudo reboot
```
- 直接下载安装包： 从NVIDIA官网下载.run文件，但此方法可能与系统更新冲突，需谨慎操作。

安装完成后，务必运行nvidia-smi确认驱动版本和支持的CUDA版本。

2. 安装NVIDIA CUDA Toolkit

根据您选择的PyTorch版本对应的CUDA版本来安装CUDA Toolkit。通常，选择与PyTorch编译版本一致或更小的CUDA Toolkit版本。

下载： 访问NVIDIA开发者网站（https://developer.nvidia.com/cuda-toolkit-archive），选择您需要的CUDA版本（例如CUDA 11.8），然后选择对应的操作系统和安装方式。

安装：

Windows： 下载.exe文件，双击运行，按照向导完成安装。注意选择“自定义”安装，可以取消安装驱动程序（如果已经安装了最新驱动）。

Linux (推荐deb或rpm方式)： 按照NVIDIA提供的指南，添加CUDA仓库并使用包管理器安装。

# 以Ubuntu 20.04安装CUDA 11.8为例
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda-repo-ubuntu2004-11-8-local_11.8.0-520.61.05-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-11-8-local_11.8.0-520.61.05-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2004-11-8-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt update
sudo apt -y install cuda-toolkit-11-8 # 注意这里安装的是toolkit，不是整个cuda包

配置环境变量： 安装完成后，需要将CUDA的bin目录和lib64目录添加到系统的PATH和LD_LIBRARY_PATH环境变量中（通常在~/.bashrc或~/.profile中添加）：
```
export PATH=/usr/local/cuda-11.8/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
source ~/.bashrc # 使环境变量生效
```
确认安装成功：运行nvcc --version。

3. 安装cuDNN

cuDNN需要与CUDA Toolkit版本对应。

下载： 访问NVIDIA cuDNN下载页面（https://developer.nvidia.com/cudnn/downloads），需要注册NVIDIA开发者账号。选择与您安装的CUDA Toolkit版本匹配的cuDNN版本。例如，对于CUDA 11.8，下载适用于CUDA 11.x的cuDNN。
安装： cuDNN通常以压缩包（.tgz或.zip）形式提供。解压后，将其中的文件复制到CUDA Toolkit的安装目录中。
- 将cuda/include/cudnn.h复制到/usr/local/cuda/include/。
- 将cuda/lib64/libcudnn*复制到/usr/local/cuda/lib64/。
- 将cuda/bin/cudnn*复制到/usr/local/cuda/bin/ (如果存在)。
（注意：/usr/local/cuda通常是/usr/local/cuda-x.x的软链接，可以直接复制到/usr/local/cuda-11.8目录中。）

4. 创建Python虚拟环境

强烈建议使用虚拟环境（如Conda或venv）来隔离不同的项目依赖，避免包冲突。

使用Conda (推荐)：

conda create -n myenv python=3.9 # 创建一个名为myenv，Python版本为3.9的虚拟环境
conda activate myenv # 激活虚拟环境

使用venv：

python3 -m venv myenv
source myenv/bin/activate # Linux/macOS
myenv\Scripts\activate # Windows

5. 安装PyTorch

在激活的虚拟环境中，根据PyTorch官方网站生成的命令进行安装。

使用pip (针对CUDA 11.8，Python 3.9)：

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

使用conda (针对CUDA 11.8，Python 3.9)：
```
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
```
注意pytorch-cuda=11.8是conda用来匹配PyTorch的CUDA依赖的，它会自动安装兼容的cudatoolkit。

安装完成后，在Python环境中运行上一节提到的检查代码，确认torch.cuda.is_available()返回True，且torch.version.cuda与您安装的PyTorch版本预期一致。

六、多版本环境管理：应对复杂需求

在实际开发中，您可能需要同时维护多个项目，而这些项目可能依赖于不同版本的PyTorch或CUDA。这时，有效的环境管理变得尤为重要。

1. Anaconda/Miniconda：管理Python、CUDA Toolkit与PyTorch

Conda是管理多个CUDA-PyTorch环境的强大工具。它可以创建独立的虚拟环境，并在每个环境中安装不同版本的Python、PyTorch以及相应的cudatoolkit和cudnn。

创建指定CUDA版本的环境：
```
conda create -n my_pytorch_env_cu118 python=3.9
conda activate my_pytorch_env_cu118
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
```
Conda会自动为您在这个环境中安装一个与PyTorch 11.8兼容的cudatoolkit包。这个cudatoolkit是PyTorch运行所需的最小依赖，它不一定会覆盖或干扰您系统上全局安装的CUDA Toolkit。

创建另一个CUDA版本的环境：

conda create -n my_pytorch_env_cu121 python=3.10
conda activate my_pytorch_env_cu121
conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

通过这种方式，您可以轻松地在不同项目之间切换，而不会导致版本冲突。

2. Docker：终极环境隔离与可复现性

Docker容器技术提供了更彻底的隔离。每个Docker容器都是一个独立的、轻量级的虚拟机，其中包含了应用程序及其所有依赖（包括操作系统、CUDA Toolkit、cuDNN、PyTorch等）。

优点：
- 完全隔离： 容器之间互不干扰，即使主机系统环境发生变化，容器内部环境也保持一致。
- 可复现性： 通过Dockerfile定义环境，可以确保无论在哪里构建，环境都完全相同。
- 易于部署： 构建好的镜像可以轻松分享和部署。
使用场景：
- 生产环境部署。
- 团队协作，确保所有成员使用相同的环境。
- 跨平台开发和测试。

示例Dockerfile (基于NVIDIA官方CUDA镜像)：

# 使用NVIDIA官方CUDA镜像作为基础，确保驱动兼容
FROM nvcr.io/nvidia/cuda:11.8.0-cudnn8-devel-ubuntu20.04

# 设置工作目录
WORKDIR /app

# 安装Python及其依赖
RUN apt-get update && apt-get install -y --no-install-recommends \
    python3.9 \
    python3-pip \
    && rm -rf /var/lib/apt/lists/*

# 设置Python别名
RUN update-alternatives --install /usr/bin/python python /usr/bin/python3.9 1

# 安装PyTorch (使用pip安装，指定CUDA版本)
# 注意：这个基础镜像已经包含了CUDA 11.8和cuDNN 8
RUN pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

# 复制您的代码
COPY . /app

# 设置启动命令
CMD ["python", "your_script.py"]

通过Docker，您可以为每个PyTorch项目创建一个独立的、预配置的环境，从而彻底解决版本兼容性问题。

七、常见问题与故障排除

即使遵循了所有步骤，仍然可能遇到问题。以下是一些常见问题及其解决方案：

torch.cuda.is_available()返回False
- 检查NVIDIA驱动： 运行nvidia-smi，确保驱动程序安装正确且GPU正常工作。
- 检查CUDA Toolkit环境变量： 确保PATH和LD_LIBRARY_PATH（Linux）包含正确的CUDA bin和lib64目录。
- PyTorch与CUDA版本不匹配： 确保您安装的PyTorch版本是为您的系统CUDA环境（特别是驱动程序支持的CUDA版本）编译的。查看PyTorch官方安装命令。
- CUDA Toolkit安装不完整或损坏： 尝试重新安装CUDA Toolkit。
cuDNN_STATUS_ARCH_MISMATCH或其他cuDNN错误
- cuDNN与CUDA Toolkit版本不匹配： 确保您下载并安装的cuDNN版本与您系统上安装的CUDA Toolkit版本兼容。
- cuDNN文件未正确复制： 检查cuDNN的.h文件和.so/.dll文件是否正确放置在CUDA Toolkit的相应目录中。
ModuleNotFoundError: No module named 'torch'
- 未激活虚拟环境： 确保您在安装PyTorch之前已经激活了正确的Python虚拟环境。
- PyTorch未安装： 在虚拟环境中运行pip list或conda list确认PyTorch是否已安装。
性能不佳或GPU利用率低
- PyTorch回退到CPU： 检查torch.cuda.is_available()是否为True。
- cuDNN未被使用或版本过旧： 检查torch.backends.cudnn.is_available()和torch.backends.cudnn.version()。确保使用了最新且兼容的cuDNN。
- CUDA版本优化不足： 某些较旧的PyTorch版本可能不支持最新CUDA的优化特性。考虑更新PyTorch和CUDA版本（如果硬件和驱动支持）。
编译CUDA扩展失败
- nvcc路径问题： 确保系统PATH环境变量中包含了正确的nvcc（CUDA Toolkit）路径。
- CUDA Toolkit版本与扩展要求不符： 有些自定义CUDA扩展可能对CUDA Toolkit版本有严格要求。

八、最佳实践与建议

为了维护一个稳定高效的深度学习环境，以下是一些推荐的最佳实践：

优先更新NVIDIA驱动： 始终首先更新您的GPU驱动到最新稳定版本，这能确保您能够利用最新的CUDA功能和优化，并支持更广泛的CUDA Toolkit和PyTorch版本。
使用官方渠道： 始终从NVIDIA官方网站下载驱动、CUDA Toolkit和cuDNN，从PyTorch官方网站获取安装命令。避免使用不可靠的第三方源。
利用虚拟环境： 对于每一个深度学习项目，都创建一个独立的Python虚拟环境（Conda或venv）。这可以有效隔离项目依赖，避免冲突，并允许您在不同项目中使用不同版本的PyTorch和CUDA。
仔细匹配版本： 在PyTorch官方安装页面选择正确的CUDA版本对应的安装命令。如果可能，将系统CUDA Toolkit版本与PyTorch编译版本保持一致或接近。
文档化您的环境： 记录下每个项目的Python版本、PyTorch版本、CUDA Toolkit版本、cuDNN版本，甚至NVIDIA驱动版本。这对于日后复现环境或排查问题非常有帮助。使用conda env export > environment.yml或pip freeze > requirements.txt来保存环境配置。
循序渐进： 当遇到问题时，不要急于尝试所有解决方案。一步一步地排查，从最底层（驱动）到上层（PyTorch代码），逐一确认。
不要盲目追求最新： 尽管最新版本通常带来性能提升和新功能，但有时稳定版本更可靠。对于生产环境或重要的研究项目，选择一个经过充分测试的稳定版本通常是更明智的选择。
学会查看日志和错误信息： 仔细阅读PyTorch、CUDA或系统输出的错误信息，它们通常包含了解决问题的关键线索。

通过遵循这些详细的指南和最佳实践，您将能够更有效地管理CUDA和PyTorch版本对应关系，构建出稳定、高效的深度学习开发和运行环境。

cuda和pytorch版本对应

cuda和pytorch版本对应深度解析：版本匹配、环境搭建与常见问题

一、理解核心组件：它们“是什么”？

NVIDIA GPU 驱动

NVIDIA CUDA Toolkit (CUDA工具包)

NVIDIA cuDNN (CUDA Deep Neural Network Library)

PyTorch

Python

二、为何版本匹配至关重要？

运行时错误与功能缺失

性能瓶颈

复杂的故障排除

不稳定的开发环境

三、如何检查现有环境版本？

检查NVIDIA GPU驱动版本

检查系统CUDA Toolkit版本

检查PyTorch使用的CUDA/cuDNN版本

检查Python版本

四、PyTorch与CUDA版本对应关系：查找与选择

1. PyTorch官方安装页面：您的首选参考

2. 理解“PyTorch编译时的CUDA版本”与“系统CUDA Toolkit版本”

3. 旧版本PyTorch与CUDA的兼容性

五、详细安装步骤：从驱动到PyTorch

1. 更新或安装NVIDIA GPU驱动

2. 安装NVIDIA CUDA Toolkit

3. 安装cuDNN

4. 创建Python虚拟环境

5. 安装PyTorch

六、多版本环境管理：应对复杂需求

1. Anaconda/Miniconda：管理Python、CUDA Toolkit与PyTorch

2. Docker：终极环境隔离与可复现性

七、常见问题与故障排除

`torch.cuda.is_available()`返回`False`

`cuDNN_STATUS_ARCH_MISMATCH`或其他cuDNN错误

`ModuleNotFoundError: No module named 'torch'`

性能不佳或GPU利用率低

编译CUDA扩展失败

八、最佳实践与建议

cuda和pytorch版本对应深度解析：版本匹配、环境搭建与常见问题

一、理解核心组件：它们“是什么”？

NVIDIA GPU 驱动

NVIDIA CUDA Toolkit (CUDA工具包)

NVIDIA cuDNN (CUDA Deep Neural Network Library)

PyTorch

Python

二、为何版本匹配至关重要？

运行时错误与功能缺失

性能瓶颈

复杂的故障排除

不稳定的开发环境

三、如何检查现有环境版本？

检查NVIDIA GPU驱动版本

检查系统CUDA Toolkit版本

检查PyTorch使用的CUDA/cuDNN版本

检查Python版本

四、PyTorch与CUDA版本对应关系：查找与选择

1. PyTorch官方安装页面：您的首选参考

2. 理解“PyTorch编译时的CUDA版本”与“系统CUDA Toolkit版本”

3. 旧版本PyTorch与CUDA的兼容性

五、详细安装步骤：从驱动到PyTorch

1. 更新或安装NVIDIA GPU驱动

2. 安装NVIDIA CUDA Toolkit

3. 安装cuDNN

4. 创建Python虚拟环境

5. 安装PyTorch

六、多版本环境管理：应对复杂需求

1. Anaconda/Miniconda：管理Python、CUDA Toolkit与PyTorch

2. Docker：终极环境隔离与可复现性

七、常见问题与故障排除

torch.cuda.is_available()返回False

cuDNN_STATUS_ARCH_MISMATCH或其他cuDNN错误

ModuleNotFoundError: No module named 'torch'

性能不佳或GPU利用率低

编译CUDA扩展失败

八、最佳实践与建议

`torch.cuda.is_available()`返回`False`

`cuDNN_STATUS_ARCH_MISMATCH`或其他cuDNN错误

`ModuleNotFoundError: No module named 'torch'`