以下为AI学习常用的数据集资源,涵盖图像、文本、语音等多领域:

🖼 图像识别数据集

  • MNIST 🧾
    手写数字识别经典数据集,包含60,000训练样本与10,000测试样本
    查看详情

    手写数字_MNIST
  • CIFAR-10 🎮
    10类彩色图像数据集(含飞机、汽车、鸟等),共60,000张32x32图片
    下载地址

    彩色图像_CIFAR10

📖 文本处理数据集

  • IMDB影评 🎬
    包含50,000条电影评论,用于情感分析训练
    数据详情

    电影评论_IMDB
  • Wikipedia语料 📖
    多语言维基百科文本数据,适合NLP模型预训练
    扩展阅读

    维基百科文本_Wikipedia

🎵 语音识别数据集

  • LibriSpeech 🎤
    基于有声书的语音数据集,包含920小时英文语音
    技术文档
    语音识别_LibriSpeech

📌 建议根据具体任务选择对应领域数据集,点击相应链接可获取数据下载地址与使用教程。需要更多数据集推荐可查看数据集分类指南