线性回归是机器学习中最基础的算法之一,适用于预测连续值问题。本文将手把手教你用Python实现线性回归模型,包含完整代码示例和可视化演示。
步骤详解 🧠
数据准备
使用Scikit-learn内置的波士顿房价数据集(已弃用,可替换为其他数据)from sklearn.datasets import load_boston boston = load_boston() X, y = boston.data, boston.target
数据分割
按8:2比例划分训练集和测试集from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
模型训练
创建线性回归实例并拟合数据from sklearn.linear_model import LinearRegression model = LinearRegression() model.fit(X_train, y_train)
预测与评估
计算R²得分和均方误差score = model.score(X_test, y_test) print(f"模型精度: {score:.2f}")
可视化演示 📈
通过散点图展示真实值与预测值的对比:
进阶学习 🔍
💡 提示:实际应用中建议使用更现代的数据集(如California房价数据集)并添加正则化项防止过拟合
返回首页获取更多Python教程资源 📚