决策树是一种常用的机器学习算法,它通过树形结构对数据进行分类或回归。Scikit-Learn 是一个强大的机器学习库,其中包含了决策树算法的实现。本教程将介绍如何使用 Scikit-Learn 的决策树进行数据分类。
数据准备
在进行决策树分类之前,我们需要准备一些数据。以下是一个简单的数据集,用于演示如何使用 Scikit-Learn 的决策树进行分类。
import pandas as pd
# 创建数据集
data = {
'Age': [25, 30, 35, 40, 45, 50, 55, 60],
'Salary': [50000, 60000, 70000, 80000, 90000, 100000, 110000, 120000],
'Experience': [1, 2, 3, 4, 5, 6, 7, 8],
'Class': ['A', 'A', 'B', 'B', 'C', 'C', 'D', 'D']
}
df = pd.DataFrame(data)
# 打印数据集
print(df)
决策树分类
接下来,我们将使用 Scikit-Learn 的决策树分类器对数据进行分类。
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
# 划分数据集
X = df[['Age', 'Salary', 'Experience']]
y = df['Class']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 创建决策树分类器
clf = DecisionTreeClassifier()
# 训练模型
clf.fit(X_train, y_train)
# 预测结果
y_pred = clf.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")
结果分析
通过上述代码,我们使用 Scikit-Learn 的决策树分类器对数据进行了分类,并计算了准确率。根据结果,我们可以看到决策树分类器在数据集上的表现良好。
决策树结构
扩展阅读
如果您想了解更多关于 Scikit-Learn 决策树的信息,可以参考以下链接:
希望这个教程能帮助您更好地理解 Scikit-Learn 决策树的使用。如果您有任何问题,欢迎在评论区留言。