决策树是一种常用的机器学习算法,可以用于分类和回归问题。在这个教程中,我们将学习如何在 Python 中使用决策树。

环境准备

在开始之前,请确保你已经安装了以下库:

  • scikit-learn
  • pandas

你可以通过以下命令安装:

pip install scikit-learn pandas

创建决策树模型

首先,我们需要导入必要的库,并创建一些示例数据。

from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split

iris = load_iris()
X = iris.data
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

接下来,我们可以创建一个决策树分类器,并训练它。

clf = DecisionTreeClassifier()
clf.fit(X_train, y_train)

评估模型

使用测试集评估模型的表现。

score = clf.score(X_test, y_test)
print(f"模型准确率:{score}")

可视化决策树

Scikit-learn 提供了一个 plot_tree 函数,可以用来可视化决策树。

from sklearn import tree

tree.plot_tree(clf)

决策树

扩展阅读

想要更深入地了解决策树?请阅读以下教程:

希望这个教程对你有所帮助!😊