Scikit-learn 是一个强大的机器学习库,它提供了丰富的算法和工具,可以帮助我们进行数据分析和建模。以下是一些关于 Scikit-learn 的基本教程内容。

安装 Scikit-learn

首先,您需要安装 Scikit-learn。您可以使用以下命令进行安装:

pip install scikit-learn

数据加载

Scikit-learn 提供了多种数据加载方法,例如:

  • load_iris():加载鸢尾花数据集
  • load_breast_cancer():加载乳腺癌数据集
from sklearn.datasets import load_iris

iris = load_iris()

模型选择

Scikit-learn 提供了多种机器学习模型,例如:

  • LinearRegression:线性回归
  • DecisionTreeClassifier:决策树分类器
  • SVMClassifier:支持向量机分类器
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.svm import SVC

# 线性回归
lr = LinearRegression()
# 决策树分类器
dt = DecisionTreeClassifier()
# 支持向量机分类器
svm = SVC()

模型训练

使用训练数据对模型进行训练:

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=42)

# 训练线性回归模型
lr.fit(X_train, y_train)
# 训练决策树分类器
dt.fit(X_train, y_train)
# 训练支持向量机分类器
svm.fit(X_train, y_train)

模型评估

使用测试数据对模型进行评估:

from sklearn.metrics import accuracy_score

# 评估线性回归模型
lr_score = accuracy_score(y_test, lr.predict(X_test))
# 评估决策树分类器
dt_score = accuracy_score(y_test, dt.predict(X_test))
# 评估支持向量机分类器
svm_score = accuracy_score(y_test, svm.predict(X_test))

print(f"线性回归准确率: {lr_score}")
print(f"决策树准确率: {dt_score}")
print(f"支持向量机准确率: {svm_score}")

扩展阅读

如果您想了解更多关于 Scikit-learn 的内容,可以访问我们的 Scikit-learn 官方文档

Scikit-learn Logo