以下是AI Challenger NLP 2023竞赛中使用的几个主要数据集:

  • 新闻分类数据集:用于新闻文本分类任务,包含多种语言和主题的新闻报道。
  • 情感分析数据集:包含用户评论和对应的情感标签,用于情感分析研究。
  • 问答数据集:包含问题和答案对,用于问答系统开发。

更多数据集信息,请访问AI Challenger 数据集页面

数据集特点

  • 多样性:涵盖了多种语言和领域,适用于不同类型的研究。
  • 质量:数据经过严格清洗和标注,保证了数据质量。
  • 开放性:数据集免费开放,供研究者使用。

图片展示

News Classification Dataset

Sentiment Analysis Dataset

Question-Answer Dataset