以下是AI Challenger NLP 2023竞赛中使用的几个主要数据集:
- 新闻分类数据集:用于新闻文本分类任务,包含多种语言和主题的新闻报道。
- 情感分析数据集:包含用户评论和对应的情感标签,用于情感分析研究。
- 问答数据集:包含问题和答案对,用于问答系统开发。
更多数据集信息,请访问AI Challenger 数据集页面。
数据集特点
- 多样性:涵盖了多种语言和领域,适用于不同类型的研究。
- 质量:数据经过严格清洗和标注,保证了数据质量。
- 开放性:数据集免费开放,供研究者使用。
图片展示
News Classification Dataset
Sentiment Analysis Dataset
Question-Answer Dataset