Python 中的常见图像数据集
在 Python 中进行图像处理和机器学习时,使用合适的数据集至关重要。以下是一些常用的图像数据集:
常见图像数据集
- CIFAR-10: 包含 10 个类别的 60,000 张 32x32 的彩色图像,每个类别 6,000 张。
- MNIST: 包含手写数字的 28x28 图像,共 70,000 张训练图像和 10,000 张测试图像。
- ImageNet: 包含超过 14,000,000 张图像,分为 21,843 个类别。
数据集使用示例
from torchvision import datasets, transforms
transform = transforms.Compose([transforms.ToTensor()])
trainset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True)
# 加载 MNIST 数据集
trainset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True)
学习资源
更多关于 Python 图像处理和机器学习的资源,请访问Python 图像处理教程。
CIFAR-10 数据集示例