以下是我们社区ABC计算论坛提供的数据集资源列表,您可以在这里找到各种计算相关的数据集。
机器学习数据集
这里列出了几个常用的机器学习数据集:
- MNIST手写数字数据集:一个包含60,000个训练样本和10,000个测试样本的手写数字数据集。
- Iris数据集:一个包含150个样本的三维数据集,通常用于分类问题。
- UCI机器学习库:一个提供多种数据集的网站,涵盖了各种机器学习任务。
自然语言处理数据集
自然语言处理领域的数据集通常用于文本分类、情感分析等任务:
- IMDb数据集:一个包含25,000个电影评论的数据集,用于情感分析。
- Twitter数据集:包含大量Twitter用户发布的推文,用于分析社交媒体数据。
- Common Crawl:一个包含大量网页内容的语料库,用于自然语言处理研究。
计算机视觉数据集
计算机视觉数据集常用于图像分类、目标检测等任务:
- ImageNet:一个包含数百万张图像的数据库,用于视觉对象识别。
- COCO数据集:一个用于目标检测和图像分割的数据集。
- MS COCO数据集:微软计算机视觉组维护的一个大型数据集,用于多种视觉任务。
机器学习
更多关于ABC计算论坛的资源,请访问我们的社区首页。