决策树是一种常用的机器学习算法,用于分类和回归任务。Scikit-learn 是 Python 中一个非常流行的机器学习库,其中包含了决策树的实现。本教程将带你了解 Scikit-learn 中的决策树算法,并演示如何使用它进行分类和回归。

简单介绍

决策树通过一系列的问题来对数据进行分类或回归。每个节点代表一个问题,分支代表可能的答案,叶子节点代表最终的分类或回归结果。

安装 Scikit-learn

在使用 Scikit-learn 之前,你需要先安装它。可以使用 pip 来安装:

pip install scikit-learn

示例

以下是一个简单的例子,展示如何使用 Scikit-learn 中的决策树进行分类:

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn import tree

# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建决策树分类器
clf = DecisionTreeClassifier()

# 训练模型
clf.fit(X_train, y_train)

# 预测测试集
y_pred = clf.predict(X_test)

# 查看准确率
print("Accuracy:", clf.score(X_test, y_test))

可视化

Scikit-learn 提供了 plot_tree 函数来可视化决策树:

import matplotlib.pyplot as plt

plt.figure(figsize=(12, 12))
tree.plot_tree(clf, filled=True)
plt.show()

决策树可视化

扩展阅读

想要了解更多关于 Scikit-learn 和决策树的知识,可以阅读以下内容:

希望这个教程能帮助你更好地理解 Scikit-learn 中的决策树算法!🌟