以下是一些常用机器学习数据集,适合中文用户参考:

  1. 经典数据集

    • 🌸 鸢尾花数据集(Iris Dataset)

      iris_dataset
      用于分类算法的入门练习,可通过 [机器学习数据集目录](/zh-cn/ml/datasets) 查看更多。
    • 📈 波士顿房价数据集(Boston Housing Dataset)

      boston_housing_dataset
      包含波士顿地区的房价信息,适合回归模型训练。
  2. 图像识别数据集

    • 🖼️ CIFAR-10 数据集

      cifar_10_dataset
      包含10种常见场景的图像,常用于深度学习模型评估。
    • 📷 ImageNet 数据集

      imagenet_dataset
      规模庞大的图像数据库,需通过 [图像处理专题](/zh-cn/ml/images) 学习使用方法。
  3. 文本分析数据集

    • 📖 20 Newsgroups 数据集

      20_newsgroups_dataset
      包含20个新闻组的文本,适合自然语言处理任务。
    • 📜 IMDb 电影评论数据集

      imdb_movie_reviews_dataset
      用于情感分析的经典文本数据集,可通过 [NLP数据集](/zh-cn/ml/nlp) 深入了解。

如需更多数据集资源,可访问 机器学习数据集目录 进行分类筛选。