统计学是机器学习的基石,为模型训练、数据分析和预测提供理论支持。以下是关键知识点:
🔑 基础概念
- 数据分布:理解数据的统计特性(如均值、方差、协方差)是特征工程的前提
- 概率模型:贝叶斯定理、最大似然估计等方法支撑分类与回归算法
- 假设检验:用于验证模型效果是否显著(如A/B测试)
- 相关性分析:识别特征与目标变量之间的统计关系
📈 应用场景
领域 | 统计方法 | 机器学习应用 |
---|---|---|
回归预测 | 线性回归 | 房价预测、销量分析 |
分类任务 | 逻辑回归 | 用户行为分类、垃圾邮件检测 |
聚类分析 | K-means | 客户分群、图像分割 |
降维技术 | PCA | 特征选择、可视化 |