召回率是评估分类模型性能的重要指标,尤其在不平衡数据集中表现突出。它衡量模型正确识别正类样本的能力,公式为:

$$ \text{Recall} = \frac{\text{TP}}{\text{TP} + \text{FN}} $$

📌 关键概念

  • TP(True Positive):模型预测为正类且实际为正类的样本数
  • FN(False Negative):模型预测为负类但实际为正类的样本数

📊 应用场景

  • 医疗诊断(识别疾病患者)
  • 垃圾邮件检测(避免误判正常邮件为垃圾)
  • 欺诈检测(捕捉潜在风险)

示例代码

from sklearn.metrics import recall_score

y_true = [0, 1, 1, 0, 1]
y_pred = [0, 1, 0, 0, 1]
recall = recall_score(y_true, y_pred)
print(f"召回率: {recall:.2f}")

拓展阅读

召回率