Python 中的常见图像数据集

在 Python 中进行图像处理和机器学习时,使用合适的数据集至关重要。以下是一些常用的图像数据集:

常见图像数据集

  • CIFAR-10: 包含 10 个类别的 60,000 张 32x32 的彩色图像,每个类别 6,000 张。
  • MNIST: 包含手写数字的 28x28 图像,共 70,000 张训练图像和 10,000 张测试图像。
  • ImageNet: 包含超过 14,000,000 张图像,分为 21,843 个类别。

数据集使用示例

from torchvision import datasets, transforms


transform = transforms.Compose([transforms.ToTensor()])
trainset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True)

# 加载 MNIST 数据集
trainset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True)

学习资源

更多关于 Python 图像处理和机器学习的资源,请访问Python 图像处理教程

CIFAR-10 数据集示例