Scikit-Learn 决策树案例教程

决策树是一种常用的机器学习算法，它通过树形结构对数据进行分类或回归。Scikit-Learn 是一个强大的机器学习库，其中包含了决策树算法的实现。本教程将介绍如何使用 Scikit-Learn 的决策树进行数据分类。

数据准备

在进行决策树分类之前，我们需要准备一些数据。以下是一个简单的数据集，用于演示如何使用 Scikit-Learn 的决策树进行分类。

import pandas as pd

# 创建数据集
data = {
    'Age': [25, 30, 35, 40, 45, 50, 55, 60],
    'Salary': [50000, 60000, 70000, 80000, 90000, 100000, 110000, 120000],
    'Experience': [1, 2, 3, 4, 5, 6, 7, 8],
    'Class': ['A', 'A', 'B', 'B', 'C', 'C', 'D', 'D']
}

df = pd.DataFrame(data)

# 打印数据集
print(df)

决策树分类

接下来，我们将使用 Scikit-Learn 的决策树分类器对数据进行分类。

from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

# 划分数据集
X = df[['Age', 'Salary', 'Experience']]
y = df['Class']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 创建决策树分类器
clf = DecisionTreeClassifier()

# 训练模型
clf.fit(X_train, y_train)

# 预测结果
y_pred = clf.predict(X_test)

# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")

结果分析

通过上述代码，我们使用 Scikit-Learn 的决策树分类器对数据进行了分类，并计算了准确率。根据结果，我们可以看到决策树分类器在数据集上的表现良好。

扩展阅读

如果您想了解更多关于 Scikit-Learn 决策树的信息，可以参考以下链接：

Scikit-Learn 官方文档 - 决策树

希望这个教程能帮助您更好地理解 Scikit-Learn 决策树的使用。如果您有任何问题，欢迎在评论区留言。