PyTorch torchvision 是一个用于计算机视觉任务的开源库,提供了许多预训练模型和工具,可以帮助用户快速构建和训练图像识别模型。
安装 torchvision
在开始使用 torchvision 之前,您需要安装 PyTorch。您可以通过以下命令安装 torchvision:
pip install torchvision
快速开始
以下是一个简单的示例,展示了如何使用 torchvision 加载和预处理图像数据:
import torchvision.transforms as transforms
from torchvision import datasets, models, transforms
# 定义转换器
transform = transforms.Compose([
transforms.Resize(256),
transforms.CenterCrop(224),
transforms.ToTensor(),
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])
# 加载训练数据集
train_dataset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
# 加载预训练模型
model = models.resnet18(pretrained=True)
# 打印模型结构
print(model)
预训练模型
torchvision 提供了多种预训练模型,包括:
- ResNet
- VGG
- AlexNet
- SqueezeNet
- MobileNet
- DPN
- ENet
- ShuffleNet
- NASNet
您可以访问 PyTorch torchvision 官方文档 了解更多关于这些模型的信息。
数据集
torchvision 提供了多个数据集,包括:
- CIFAR10
- CIFAR100
- ImageNet
- COCO
- MNIST
您可以访问 PyTorch torchvision 数据集文档 了解更多关于这些数据集的信息。
CIFAR-10 图像示例
进一步阅读
如果您想了解更多关于 torchvision 的信息,可以阅读以下文档:
希望这些信息能帮助您更好地了解和使用 torchvision!