GLUE(General Language Understanding Evaluation)是自然语言处理领域广泛使用的基准测试套件,包含多个经典任务的数据集,用于评估模型的综合语言理解能力。以下是核心数据集概览:

  1. MNLI (Matching Natural Language Inference)
    用于自然语言推理任务,包含蕴含关系判断数据

    MNLI
    [了解更多 → /glue_introduction](/glue_introduction)
  2. SST-2 (Sentiment Sentiment Analysis)
    二分类情感分析数据集,包含电影评论情感标签

    SST-2
  3. QQP (Quora Question Pair)
    问答对相似度判断任务,用于检测语义等价性

    QQP
  4. CoLA (Corruptible Language Acceptability)
    语法正确性判断数据集,包含重写后的句子

    CoLA

💡 使用提示

如需特定任务的使用案例或数据格式说明,可进一步查阅相关文档 📖