PyTorch torchvision 简介

PyTorch torchvision 是一个流行的 Python 库，用于处理图像数据，是 PyTorch 的一部分。它提供了许多用于图像处理和计算机视觉任务的工具和功能。

主要功能

数据加载和转换：提供了一系列的数据加载器，可以将图像数据转换为适合 PyTorch 模型训练的格式。
预训练模型：包含了许多预训练的模型，如 ResNet、VGG、AlexNet 等，可以直接用于图像分类、目标检测等任务。
可视化工具：提供了可视化工具，可以帮助用户查看图像数据。

安装

要安装 torchvision，可以使用以下命令：

pip install torchvision

示例

以下是一个简单的示例，展示了如何使用 torchvision 加载图像并进行预处理：

import torchvision.transforms as transforms
from torchvision import datasets, models, utils

# 定义转换
transform = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])

# 加载图像
image = Image.open('path_to_image.jpg')
image = transform(image).unsqueeze(0)

# 使用预训练模型
model = models.resnet18(pretrained=True)
model.eval()

# 预测
outputs = model(image)
_, predicted = torch.max(outputs, 1)
print('Predicted:', predicted.item())

扩展阅读

更多关于 torchvision 的信息，请访问 PyTorch torchvision 官方文档。