PyTorch Vision 是 PyTorch 生态系统的一部分,专门用于计算机视觉任务。以下是一些基础教程,帮助您开始使用 PyTorch Vision。
快速入门
安装 PyTorch Vision:确保您的 PyTorch 环境已经安装了
torchvision
包。pip install torchvision
加载和显示图像:
import torchvision.transforms as transforms import torchvision.datasets as datasets from PIL import Image transform = transforms.Compose([ transforms.Resize((256, 256)), transforms.ToTensor(), ]) dataset = datasets.ImageFolder(root='path_to_dataset', transform=transform) image, label = dataset[0] image.show()
数据增强:
from torchvision.transforms import RandomHorizontalFlip, RandomVerticalFlip transform = transforms.Compose([ RandomHorizontalFlip(), RandomVerticalFlip(), transforms.ToTensor(), ])
实践案例
图像分类:使用预训练模型进行图像分类。
import torch.nn as nn import torch.optim as optim model = torchvision.models.resnet18(pretrained=True) model.fc = nn.Linear(model.fc.in_features, 10) # 假设我们有10个类别 criterion = nn.CrossEntropyLoss() optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9) # 训练过程...
目标检测:使用
torchvision
中的目标检测模型。import torchvision.models.detection as models model = models.faster_rcnn_resnet50_fpn(pretrained=True) # 训练和评估过程...
扩展阅读
想了解更多关于 PyTorch Vision 的信息?请访问我们的PyTorch Vision 教程页面。