以下是AI Challenger NLP 2023竞赛所使用的数据集资源,包含文本数据、标注数据等,供参赛者参考和使用。

数据集列表

数据集详情

新闻文本数据集

该数据集包含大量的新闻文本,用于训练和测试文本分类、情感分析等任务。

  • 数据量:100万条新闻文本
  • 数据格式:JSON

社交媒体文本数据集

该数据集包含社交媒体平台上的文本数据,用于训练和测试文本分类、情感分析等任务。

  • 数据量:50万条社交媒体文本
  • 数据格式:CSV

问答文本数据集

该数据集包含问答对,用于训练和测试问答系统。

  • 数据量:10万条问答对
  • 数据格式:JSON

更多资源

如需了解更多关于AI Challenger NLP 2023竞赛的信息,请访问竞赛官网


相关图片