Scikit-Learn 是一个强大的机器学习库,用于数据挖掘和数据分析。本教程将介绍如何使用 Scikit-Learn 进行分类任务。

分类方法

Scikit-Learn 提供了多种分类算法,以下是一些常见的分类方法:

  • 逻辑回归(Logistic Regression)
  • 支持向量机(Support Vector Machine, SVM)
  • 决策树(Decision Tree)
  • 随机森林(Random Forest)
  • K-最近邻(K-Nearest Neighbors, KNN)

逻辑回归

逻辑回归是一种广泛使用的分类方法,适用于二分类问题。以下是一个简单的逻辑回归示例:

from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris

# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)

# 创建逻辑回归模型
model = LogisticRegression()

# 训练模型
model.fit(X_train, y_train)

# 评估模型
score = model.score(X_test, y_test)
print("模型准确率:", score)

支持向量机

支持向量机(SVM)是一种有效的分类方法,适用于各种类型的数据。以下是一个简单的 SVM 示例:

from sklearn.svm import SVC
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris

# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)

# 创建 SVM 模型
model = SVC()

# 训练模型
model.fit(X_train, y_train)

# 评估模型
score = model.score(X_test, y_test)
print("模型准确率:", score)

决策树

决策树是一种直观的分类方法,适用于各种类型的数据。以下是一个简单的决策树示例:

from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris

# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)

# 创建决策树模型
model = DecisionTreeClassifier()

# 训练模型
model.fit(X_train, y_train)

# 评估模型
score = model.score(X_test, y_test)
print("模型准确率:", score)

扩展阅读

更多关于 Scikit-Learn 的教程,请访问我们的 Scikit-Learn 教程页面

[

Logistic Regression
]

[

Support Vector Machine
]

[

Decision Tree
]