什么是决策树?

决策树是一种常见的机器学习算法,用于分类和回归任务。它通过树状结构对数据进行分割,每一步选择最优特征进行划分,直到达到停止条件。

决策树_原理

Python 实现步骤

  1. 数据准备
    使用 pandas 加载数据集:

    import pandas as pd
    data = pd.read_csv("your_dataset.csv")
    
  2. 划分训练集与测试集
    通过 train_test_split 分割数据:

    from sklearn.model_selection import train_test_split
    X_train, X_test, y_train, y_test = train_test_split(data.drop("target", axis=1), data["target"], test_size=0.2)
    
  3. 训练决策树模型
    调用 DecisionTreeClassifier 进行训练:

    from sklearn.tree import DecisionTreeClassifier
    model = DecisionTreeClassifier()
    model.fit(X_train, y_train)
    
  4. 模型评估
    计算准确率:

    accuracy = model.score(X_test, y_test)
    print(f"准确率: {accuracy:.2f}")
    

扩展阅读

决策树_实现
决策树_应用