scikit-learn 示例教程 📚

欢迎来到 scikit-learn 的中文示例页面！这是一个用于数据挖掘和数据分析的机器学习库，基于 Python。以下是快速上手指南：

🚀 快速入门

安装：使用 pip install scikit-learn 安装库
核心模块：
- sklearn.linear_model：线性回归/分类
- sklearn.cluster：聚类算法
- sklearn.tree：决策树
数据处理：通过 /zh/tutorials/data_preprocessing 学习数据清洗技巧

📊 示例代码

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier

# 加载数据集
data = load_iris()
X_train, X_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.2)

# 训练模型
model = RandomForestClassifier()
model.fit(X_train, y_train)

# 预测结果
predictions = model.predict(X_test)
print("预测准确率:", model.score(X_test, y_test))

🌱 应用场景

分类任务：手写数字识别（使用 /zh/examples/classification 查看完整案例）
回归分析：房价预测
聚类分析：客户分群
降维处理：PCA 特征压缩

📖 扩展阅读

想深入了解 scikit-learn 的高级用法？点击这里获取完整教程！