线性回归是机器学习中最基础的算法之一,用于建模变量之间的线性关系。以下是关键知识点:
核心概念 📌
- 定义:通过拟合数据点的直线(或平面)来预测连续值
- 公式:
y = wx + b
(单变量)或y = Xw + b
(多变量) - 目标:最小化预测值与真实值的误差平方和
实现步骤 🧰
数据准备
收集特征值(X)与目标值(y)的对应关系数据点分布参数估计
使用最小二乘法计算权重(w)和偏置(b)例如:
w = (X^T X)^{-1} X^T y
(公式可点击数学推导深入了解)模型评估
通过R²、MAE等指标衡量拟合效果回归线示意图
应用场景 🌍
- 房价预测(面积→价格)
- 销售趋势分析(时间→销售额)
- 科学实验数据拟合