PyTorch torchvision 文档

PyTorch torchvision 是一个用于计算机视觉任务的开源库，提供了许多预训练模型和工具，可以帮助用户快速构建和训练图像识别模型。

安装 torchvision

在开始使用 torchvision 之前，您需要安装 PyTorch。您可以通过以下命令安装 torchvision：

pip install torchvision

快速开始

以下是一个简单的示例，展示了如何使用 torchvision 加载和预处理图像数据：

import torchvision.transforms as transforms
from torchvision import datasets, models, transforms

# 定义转换器
transform = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])

# 加载训练数据集
train_dataset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)

# 加载预训练模型
model = models.resnet18(pretrained=True)

# 打印模型结构
print(model)

预训练模型

torchvision 提供了多种预训练模型，包括：

ResNet
VGG
AlexNet
SqueezeNet
MobileNet
DPN
ENet
ShuffleNet
NASNet

您可以访问 PyTorch torchvision 官方文档了解更多关于这些模型的信息。

数据集

torchvision 提供了多个数据集，包括：

CIFAR10
CIFAR100
ImageNet
COCO
MNIST

您可以访问 PyTorch torchvision 数据集文档了解更多关于这些数据集的信息。

进一步阅读

如果您想了解更多关于 torchvision 的信息，可以阅读以下文档：

希望这些信息能帮助您更好地了解和使用 torchvision！