PyTorch Vision 是 PyTorch 的一个库,专门用于计算机视觉任务。以下是一些关于 PyTorch Vision 的基本信息:

快速开始

  • 安装 PyTorch Vision: pip install torch torchvision
  • 导入库: import torchvision

标准数据集

PyTorch Vision 提供了多种标准数据集,例如:

  • CIFAR-10
  • ImageNet
  • COCO

模型

PyTorch Vision 提供了多种预训练模型,包括:

  • ResNet
  • VGG
  • Inception

示例

以下是一个使用 PyTorch Vision 的简单示例:

import torchvision
import torchvision.transforms as transforms
import torchvision.datasets as datasets


transform = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])

# 加载数据集
train_dataset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)

# 使用 DataLoader
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=4, shuffle=True)

# 遍历数据集
for batch_idx, (data, target) in enumerate(train_loader):
    print(data.shape, target)
    if batch_idx == 0:
        break

更多资源

如果您想了解更多关于 PyTorch Vision 的信息,可以访问官方文档

PyTorch Vision Logo