分类教程

分类是机器学习中一个重要的基础概念，它可以帮助我们理解数据，提取特征，并做出预测。以下是一些关于分类的基本教程。

1. 什么是分类？

分类是一种监督学习任务，其目标是根据输入数据将数据分为不同的类别。例如，我们可以使用分类算法来识别邮件是否为垃圾邮件，或者预测一个图片中是否包含猫。

2. 常见的分类算法

逻辑回归：一种简单的二分类算法，常用于处理线性可分的数据。
支持向量机（SVM）：通过找到一个超平面来将数据分为不同的类别。
决策树：通过一系列的规则来对数据进行分类。
随机森林：由多个决策树组成的集成学习方法。

3. 分类实例

以下是一个简单的例子，展示如何使用逻辑回归进行分类。

from sklearn.linear_model import LogisticRegression
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

# 加载数据
iris = load_iris()
X, y = iris.data, iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建逻辑回归模型
model = LogisticRegression()

# 训练模型
model.fit(X_train, y_train)

# 预测
y_pred = model.predict(X_test)

# 评估模型
print("Accuracy:", model.score(X_test, y_test))

4. 扩展阅读

如果你对分类有更深入的兴趣，可以阅读以下教程：