决策树是一种直观且易于理解的机器学习算法,常用于分类和回归任务。以下是使用Python实现决策树的基本指南:
1. 安装依赖
确保已安装scikit-learn
库:
pip install scikit-learn
2. 代码示例
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
# 加载数据集 📁
data = load_iris()
X = data.data
y = data.target
# 划分训练集与测试集 📊
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# 创建决策树模型 🧠
model = DecisionTreeClassifier(criterion='gini', max_depth=3)
model.fit(X_train, y_train)
# 可视化树结构 📖
plt.figure(figsize=(12,8))
plot_tree(model, feature_names=data.feature_names, class_names=data.target_names, filled=True)
plt.savefig('decision_tree.png') # 保存图像
3. 应用场景
- 分类任务:如客户分群、垃圾邮件检测 ✅
- 回归任务:如房价预测、销售趋势分析 📈
- 可视化分析:通过树形结构直观展示决策逻辑 🌐
4. 扩展阅读
- 决策树算法详解 📘
- Python机器学习库使用指南 🛠️