以下是一些常用的机器学习数据集,它们被广泛应用于各种机器学习任务中。

  • MNIST 手写数字数据集:包含 60,000 个训练样本和 10,000 个测试样本,每个样本是一个 28x28 的灰度图像,代表一个手写数字。
  • CIFAR-10 数据集:包含 10 个类别的 60,000 个 32x32 彩色图像,分为 50,000 个训练样本和 10,000 个测试样本。
  • ImageNet 数据集:是目前规模最大的视觉数据库,包含超过 1,000 万个图像,涉及超过 21,000 个类别。

更多关于数据集的信息,可以参考数据集列表

图片示例

中心图像展示了 MNIST 数据集中的手写数字样本。

MNIST