多项式回归是一种常用的机器学习算法,它可以对数据进行更复杂的建模。Scikit-learn 是一个强大的 Python 库,提供了多项式回归的实现。

多项式回归简介

多项式回归是一种扩展的线性回归模型,它将输入特征的幂次方作为新的特征添加到模型中。这使得模型能够捕捉到数据中的非线性关系。

使用 Scikit-learn 进行多项式回归

以下是使用 Scikit-learn 进行多项式回归的基本步骤:

  1. 导入必要的库
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
  1. 准备数据
# 假设我们有一组数据
X = np.array([1, 2, 3, 4, 5])
y = np.array([2, 4, 5, 4, 5])
  1. 创建多项式特征
poly = PolynomialFeatures(degree=2)
X_poly = poly.fit_transform(X)
  1. 训练模型
model = LinearRegression()
model.fit(X_poly, y)
  1. 预测
X_new = np.array([6])
X_new_poly = poly.transform(X_new)
y_pred = model.predict(X_new_poly)
print("预测值:", y_pred)

多项式回归的局限性

多项式回归虽然可以捕捉非线性关系,但过高的多项式阶数会导致过拟合。因此,选择合适的阶数是非常重要的。

扩展阅读

如果您想了解更多关于 Scikit-learn 的信息,可以访问我们的 Scikit-learn 教程

Polynomial Regression

返回教程列表