多项式回归是一种常用的机器学习算法,它可以对数据进行更复杂的建模。Scikit-learn 是一个强大的 Python 库,提供了多项式回归的实现。
多项式回归简介
多项式回归是一种扩展的线性回归模型,它将输入特征的幂次方作为新的特征添加到模型中。这使得模型能够捕捉到数据中的非线性关系。
使用 Scikit-learn 进行多项式回归
以下是使用 Scikit-learn 进行多项式回归的基本步骤:
- 导入必要的库:
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
- 准备数据:
# 假设我们有一组数据
X = np.array([1, 2, 3, 4, 5])
y = np.array([2, 4, 5, 4, 5])
- 创建多项式特征:
poly = PolynomialFeatures(degree=2)
X_poly = poly.fit_transform(X)
- 训练模型:
model = LinearRegression()
model.fit(X_poly, y)
- 预测:
X_new = np.array([6])
X_new_poly = poly.transform(X_new)
y_pred = model.predict(X_new_poly)
print("预测值:", y_pred)
多项式回归的局限性
多项式回归虽然可以捕捉非线性关系,但过高的多项式阶数会导致过拟合。因此,选择合适的阶数是非常重要的。
扩展阅读
如果您想了解更多关于 Scikit-learn 的信息,可以访问我们的 Scikit-learn 教程。
Polynomial Regression