📚 中文语料库精选

  • CTB 7.0:中文树库项目,包含新闻语料与句法标注

    中文语料库
    [查看相关教程](/tutorial/ctb-corpus)
  • PKU Treebank:北京大学研发的中文依存句法语料库
    探索中文分词工具

  • THUCNews:中文新闻语料库,常用于文本分类任务

    中文新闻语料库

🧠 预训练模型数据集

📊 行业应用数据集

  • SIGHAN Bakeoff:中文手写识别数据集

    中文手写识别数据集
  • Chinese Web Question:中文网络问答数据集,用于问答系统研究
    查看数据集使用案例