什么是决策树?
决策树是一种常见的机器学习算法,用于分类和回归任务。它通过树状结构对数据进行分割,每一步选择最优特征进行划分,直到达到停止条件。
Python 实现步骤
数据准备
使用pandas
加载数据集:import pandas as pd data = pd.read_csv("your_dataset.csv")
划分训练集与测试集
通过train_test_split
分割数据:from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(data.drop("target", axis=1), data["target"], test_size=0.2)
训练决策树模型
调用DecisionTreeClassifier
进行训练:from sklearn.tree import DecisionTreeClassifier model = DecisionTreeClassifier() model.fit(X_train, y_train)
模型评估
计算准确率:accuracy = model.score(X_test, y_test) print(f"准确率: {accuracy:.2f}")