Python 线性回归教程

线性回归是机器学习中的一种基础算法，用于预测连续值。本教程将介绍如何在 Python 中使用线性回归进行数据分析和预测。

线性回归原理

线性回归通过建立一个线性模型来预测目标变量。模型表达式如下：

$$ y = ax + b $$

其中，$y$ 是目标变量，$x$ 是特征变量，$a$ 是斜率，$b$ 是截距。

在进行线性回归之前，我们需要安装一些必要的库，如 NumPy 和 scikit-learn。

pip install numpy scikit-learn

以下是一个简单的数据集，其中包含年龄和收入两个特征。

import numpy as np

# 创建数据集
X = np.array([[25, 30000], [30, 35000], [35, 40000], [40, 45000]])
y = np.array([30000, 35000, 40000, 45000])

使用 scikit-learn 的 LinearRegression 类来训练模型。

from sklearn.linear_model import LinearRegression

# 创建线性回归模型
model = LinearRegression()

# 训练模型
model.fit(X, y)

使用训练好的模型进行预测。

# 预测年龄为 45 的人的收入
predicted_income = model.predict([[45, 0]])
print(predicted_income)

想了解更多关于线性回归的知识？请阅读我们的线性回归进阶教程。