以下是一些常用的机器学习数据集,它们被广泛应用于各种机器学习任务中。
- MNIST 手写数字数据集:包含 60,000 个训练样本和 10,000 个测试样本,每个样本是一个 28x28 的灰度图像,代表一个手写数字。
- CIFAR-10 数据集:包含 10 个类别的 60,000 个 32x32 彩色图像,分为 50,000 个训练样本和 10,000 个测试样本。
- ImageNet 数据集:是目前规模最大的视觉数据库,包含超过 1,000 万个图像,涉及超过 21,000 个类别。
更多关于数据集的信息,可以参考数据集列表。
图片示例
中心图像展示了 MNIST 数据集中的手写数字样本。