以下是一些常见的机器学习数据集,它们被广泛应用于各种机器学习任务中。

  • MNIST 数据集: 包含手写数字的图片,是图像识别任务的基础数据集。了解更多
  • CIFAR-10 数据集: 包含10类共60000张32x32彩色图片,常用于图像分类任务。了解更多
  • ImageNet 数据集: 包含超过1400万张图片,是图像识别任务的重要数据集。了解更多

中文数据集

  • CTW1500 数据集: 包含超过15000张包含中文文本的图片,适用于文本检测任务。了解更多
  • ICDAR 数据集: 包含大量包含表格、手写文本和印刷文本的图片,适用于文本识别任务。了解更多

机器学习数据集