决策树是一种直观且易于理解的机器学习算法,常用于分类和回归任务。以下是使用Python实现决策树的基本指南:

1. 安装依赖

确保已安装scikit-learn库:

pip install scikit-learn

2. 代码示例

from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt

# 加载数据集 📁
data = load_iris()
X = data.data
y = data.target

# 划分训练集与测试集 📊
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# 创建决策树模型 🧠
model = DecisionTreeClassifier(criterion='gini', max_depth=3)
model.fit(X_train, y_train)

# 可视化树结构 📖
plt.figure(figsize=(12,8))
plot_tree(model, feature_names=data.feature_names, class_names=data.target_names, filled=True)
plt.savefig('decision_tree.png')  # 保存图像

3. 应用场景

  • 分类任务:如客户分群、垃圾邮件检测 ✅
  • 回归任务:如房价预测、销售趋势分析 📈
  • 可视化分析:通过树形结构直观展示决策逻辑 🌐

4. 扩展阅读

决策树_结构
Python_实现