TorchVision 是 PyTorch 的一部分,提供了一系列用于计算机视觉的库和工具。它包括数据加载、预处理、模型构建和训练等功能。

功能模块

  • 数据加载与预处理:支持多种数据集加载,并提供了一系列预处理工具。
  • 模型构建:提供了预训练模型和可微分的模型组件,方便用户进行模型构建。
  • 训练与评估:支持模型训练和评估,包括损失函数、优化器等。

快速开始

要使用 TorchVision,首先需要安装 PyTorch:

pip install torch torchvision

安装完成后,你可以这样导入并使用它:

import torch
import torchvision

图像分类

以下是一个简单的图像分类示例:

import torchvision.transforms as transforms
from torchvision import datasets, models, transforms

# 数据预处理
transform = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])

# 加载数据集
trainset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True)

# 加载预训练模型
model = models.resnet18(pretrained=True)

# 训练模型(此处省略具体训练代码)

更多信息

想要了解更多关于 TorchVision 的信息,可以访问 PyTorch 官方文档

图片示例

猫咪

的中心,我们可以看到一只可爱的小猫咪。

Cat

狗狗

另一张图片中,我们可以看到一只忠诚的狗狗。

Dog