Scikit-Learn 是一个强大的机器学习库,用于数据挖掘和数据分析。本教程将介绍如何使用 Scikit-Learn 进行分类任务。
分类方法
Scikit-Learn 提供了多种分类算法,以下是一些常见的分类方法:
- 逻辑回归(Logistic Regression)
- 支持向量机(Support Vector Machine, SVM)
- 决策树(Decision Tree)
- 随机森林(Random Forest)
- K-最近邻(K-Nearest Neighbors, KNN)
逻辑回归
逻辑回归是一种广泛使用的分类方法,适用于二分类问题。以下是一个简单的逻辑回归示例:
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
# 创建逻辑回归模型
model = LogisticRegression()
# 训练模型
model.fit(X_train, y_train)
# 评估模型
score = model.score(X_test, y_test)
print("模型准确率:", score)
支持向量机
支持向量机(SVM)是一种有效的分类方法,适用于各种类型的数据。以下是一个简单的 SVM 示例:
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
# 创建 SVM 模型
model = SVC()
# 训练模型
model.fit(X_train, y_train)
# 评估模型
score = model.score(X_test, y_test)
print("模型准确率:", score)
决策树
决策树是一种直观的分类方法,适用于各种类型的数据。以下是一个简单的决策树示例:
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
# 创建决策树模型
model = DecisionTreeClassifier()
# 训练模型
model.fit(X_train, y_train)
# 评估模型
score = model.score(X_test, y_test)
print("模型准确率:", score)
扩展阅读
更多关于 Scikit-Learn 的教程,请访问我们的 Scikit-Learn 教程页面。
[
[
[