欢迎访问「自然语言处理数据集专区」,这里为您整理了主流NLP数据集资源和技术文档:
常用数据集推荐 📊
CC-BY(Creative Commons License)
点击查看授权协议详情OpenSubtitles(开放字幕数据集)
包含10万+电影对白语料SQuAD(阅读理解基准测试)
进入测试平台
开源项目支持 🌐
- Hugging Face datasets:100+预处理模块
- TensorFlow Datasets:内置200+数据集
- GLUE Benchmark:12项标准任务数据集