🚀 什么是线性回归?
线性回归是统计学中用于建模变量间线性关系的经典方法,核心目标是通过拟合数据找到最佳直线(或超平面)来预测连续值。其公式为:
y = wx + b
其中 w
是权重,b
是偏置项,x
为输入特征,y
为预测输出。
📊 核心概念图解
- 特征与标签:输入数据
x
和目标值y
- 损失函数:最小化预测值与真实值的误差(如均方误差)
- 优化算法:梯度下降法寻找最优参数
- 拟合效果:通过散点图和回归线可视化
💻 Python代码示例
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
# 示例数据
X = np.array([[1], [2], [3], [4], [5]])
y = np.array([2, 4, 5, 4, 5])
# 创建模型
model = LinearRegression()
model.fit(X, y)
# 预测与可视化
plt.scatter(X, y, color='blue', label='数据点')
plt.plot(X, model.predict(X), color='red', label='回归线')
plt.xlabel('特征X')
plt.ylabel('目标Y')
plt.legend()
plt.show()
📈 应用场景案例
- 房价预测:根据面积预测房屋价格
- 销售分析:基于广告投入预测销售额
- 趋势预测:分析时间序列数据的长期趋势
📚 扩展阅读
想深入了解机器学习基础?点击 这里 查看更多教程!