👋 欢迎来到 Scikit-learn 高级功能学习页面!以下是关键知识点与实践指南:

📊 模型评估

  • 常用指标:准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1 分数(F1 Score)
  • 混淆矩阵:可视化分类结果,通过 sklearn.metrics.confusion_matrix 实现
  • 回归任务:均方误差(MSE)、R² 分数(R² Score)
    👉 点击查看模型评估详细示例

🧠 特征工程

  • 数据预处理:缺失值处理、编码分类变量(如 OneHotEncoder
  • 特征缩放:标准化(StandardScaler)、归一化(MinMaxScaler
  • 特征选择:基于方差阈值、递归特征消除(RFE)
    🖼️
    特征工程

🔄 交叉验证

  • K 折交叉验证cross_val_score 实现,避免数据过拟合
  • 留一法(Leave-One-Out):适用于小数据集,但计算成本高
  • 分层抽样:保持类别分布一致性,使用 StratifiedKFold
    🖼️
    交叉验证

🎯 模型调优

  • 网格搜索GridSearchCV 批量测试超参数组合
  • 随机搜索RandomizedSearchCV 更高效地探索参数空间
  • 学习曲线:分析模型表现与训练样本量的关系
    🖼️
    超参数调优

📚 扩展阅读