线性回归是机器学习中最基础的算法之一,适用于预测连续值问题。本文将手把手教你用Python实现线性回归模型,包含完整代码示例和可视化演示。

步骤详解 🧠

  1. 数据准备
    使用Scikit-learn内置的波士顿房价数据集(已弃用,可替换为其他数据)

    from sklearn.datasets import load_boston
    boston = load_boston()
    X, y = boston.data, boston.target
    
  2. 数据分割
    按8:2比例划分训练集和测试集

    from sklearn.model_selection import train_test_split
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
    
  3. 模型训练
    创建线性回归实例并拟合数据

    from sklearn.linear_model import LinearRegression
    model = LinearRegression()
    model.fit(X_train, y_train)
    
  4. 预测与评估
    计算R²得分和均方误差

    score = model.score(X_test, y_test)
    print(f"模型精度: {score:.2f}")
    

可视化演示 📈

线性回归_示意图

通过散点图展示真实值与预测值的对比:

散点图_趋势线

进阶学习 🔍

💡 提示:实际应用中建议使用更现代的数据集(如California房价数据集)并添加正则化项防止过拟合

返回首页获取更多Python教程资源 📚