决策树是一种常用的机器学习算法,用于分类和回归任务。Scikit-learn 是 Python 中一个非常流行的机器学习库,其中包含了决策树的实现。本教程将带你了解 Scikit-learn 中的决策树算法,并演示如何使用它进行分类和回归。
简单介绍
决策树通过一系列的问题来对数据进行分类或回归。每个节点代表一个问题,分支代表可能的答案,叶子节点代表最终的分类或回归结果。
安装 Scikit-learn
在使用 Scikit-learn 之前,你需要先安装它。可以使用 pip 来安装:
pip install scikit-learn
示例
以下是一个简单的例子,展示如何使用 Scikit-learn 中的决策树进行分类:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn import tree
# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建决策树分类器
clf = DecisionTreeClassifier()
# 训练模型
clf.fit(X_train, y_train)
# 预测测试集
y_pred = clf.predict(X_test)
# 查看准确率
print("Accuracy:", clf.score(X_test, y_test))
可视化
Scikit-learn 提供了 plot_tree
函数来可视化决策树:
import matplotlib.pyplot as plt
plt.figure(figsize=(12, 12))
tree.plot_tree(clf, filled=True)
plt.show()
决策树可视化
扩展阅读
想要了解更多关于 Scikit-learn 和决策树的知识,可以阅读以下内容:
希望这个教程能帮助你更好地理解 Scikit-learn 中的决策树算法!🌟