线性回归案例研究

线性回归是一种常用的统计方法，用于分析两个或多个变量之间的关系。本教程将提供一个线性回归案例研究，以帮助您更好地理解线性回归的基本概念和应用。

案例背景

假设我们正在研究房价与房屋面积之间的关系。我们收集了以下数据：

房屋面积（平方米）
房屋价格（万元）

数据预处理

在开始建模之前，我们需要对数据进行预处理，包括：

缺失值处理
异常值处理
数据标准化

建立线性回归模型

使用Python中的statsmodels库，我们可以建立一个线性回归模型：

import statsmodels.api as sm

# 创建数据集
X = [[0.5], [1.0], [1.5], [2.0], [2.5]]
y = [5.0, 6.0, 7.0, 8.0, 9.0]

# 添加常数项
X = sm.add_constant(X)

# 建立线性回归模型
model = sm.OLS(y, X).fit()

# 输出模型结果
print(model.summary())

模型评估

为了评估模型的性能，我们可以使用以下指标：

R²
调整R²
平均绝对误差（MAE）

# 输出模型评估指标
print("R²:", model.rsquared)
print("调整R²:", model.rsquared_adj)
print("MAE:", model.meanabs())

模型预测

使用训练好的模型，我们可以对新的数据进行预测：

# 新数据
new_data = [[3.0]]

# 预测房价
predicted_price = model.predict(new_data)
print("预测房价：", predicted_price[0])

扩展阅读

想要了解更多关于线性回归的知识，请访问我们的线性回归教程。