TorchVision 是 PyTorch 的一部分,提供了一系列用于计算机视觉的库和工具。它包括数据加载、预处理、模型构建和训练等功能。
功能模块
- 数据加载与预处理:支持多种数据集加载,并提供了一系列预处理工具。
- 模型构建:提供了预训练模型和可微分的模型组件,方便用户进行模型构建。
- 训练与评估:支持模型训练和评估,包括损失函数、优化器等。
快速开始
要使用 TorchVision,首先需要安装 PyTorch:
pip install torch torchvision
安装完成后,你可以这样导入并使用它:
import torch
import torchvision
图像分类
以下是一个简单的图像分类示例:
import torchvision.transforms as transforms
from torchvision import datasets, models, transforms
# 数据预处理
transform = transforms.Compose([
transforms.Resize(256),
transforms.CenterCrop(224),
transforms.ToTensor(),
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])
# 加载数据集
trainset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True)
# 加载预训练模型
model = models.resnet18(pretrained=True)
# 训练模型(此处省略具体训练代码)
更多信息
想要了解更多关于 TorchVision 的信息,可以访问 PyTorch 官方文档。
图片示例
猫咪
的中心,我们可以看到一只可爱的小猫咪。
狗狗
另一张图片中,我们可以看到一只忠诚的狗狗。