👋 欢迎来到 Scikit-learn 高级功能学习页面!以下是关键知识点与实践指南:
📊 模型评估
- 常用指标:准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1 分数(F1 Score)
- 混淆矩阵:可视化分类结果,通过
sklearn.metrics.confusion_matrix
实现 - 回归任务:均方误差(MSE)、R² 分数(R² Score)
👉 点击查看模型评估详细示例
🧠 特征工程
- 数据预处理:缺失值处理、编码分类变量(如
OneHotEncoder
) - 特征缩放:标准化(
StandardScaler
)、归一化(MinMaxScaler
) - 特征选择:基于方差阈值、递归特征消除(RFE)
🖼️
🔄 交叉验证
- K 折交叉验证:
cross_val_score
实现,避免数据过拟合 - 留一法(Leave-One-Out):适用于小数据集,但计算成本高
- 分层抽样:保持类别分布一致性,使用
StratifiedKFold
🖼️
🎯 模型调优
- 网格搜索:
GridSearchCV
批量测试超参数组合 - 随机搜索:
RandomizedSearchCV
更高效地探索参数空间 - 学习曲线:分析模型表现与训练样本量的关系
🖼️
📚 扩展阅读
- 想深入学习模型选择?前往 Scikit-learn 模型选择教程
- 可参考官方文档了解更多细节:Scikit-learn 官方文档