PyTorch torchvision 是一个流行的 Python 库,用于处理图像数据,是 PyTorch 的一部分。它提供了许多用于图像处理和计算机视觉任务的工具和功能。

主要功能

  • 数据加载和转换:提供了一系列的数据加载器,可以将图像数据转换为适合 PyTorch 模型训练的格式。
  • 预训练模型:包含了许多预训练的模型,如 ResNet、VGG、AlexNet 等,可以直接用于图像分类、目标检测等任务。
  • 可视化工具:提供了可视化工具,可以帮助用户查看图像数据。

安装

要安装 torchvision,可以使用以下命令:

pip install torchvision

示例

以下是一个简单的示例,展示了如何使用 torchvision 加载图像并进行预处理:

import torchvision.transforms as transforms
from torchvision import datasets, models, utils

# 定义转换
transform = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])

# 加载图像
image = Image.open('path_to_image.jpg')
image = transform(image).unsqueeze(0)

# 使用预训练模型
model = models.resnet18(pretrained=True)
model.eval()

# 预测
outputs = model(image)
_, predicted = torch.max(outputs, 1)
print('Predicted:', predicted.item())

扩展阅读

更多关于 torchvision 的信息,请访问 PyTorch torchvision 官方文档

PyTorch torchvision Logo