Scikit-Learn 是一个开源的 Python 工具,用于数据挖掘和数据分析。它提供了一个丰富的算法库,包括分类、回归、聚类、降维等。
主要特点
- 简单易用:Scikit-Learn 提供了简单直观的 API,易于学习和使用。
- 算法丰富:包含了多种机器学习算法,满足不同需求。
- 集成度高:可以与其他 Python 数据分析库(如 NumPy、Pandas)无缝集成。
安装
您可以通过以下命令安装 Scikit-Learn:
pip install scikit-learn
示例
以下是一个使用 Scikit-Learn 进行分类的简单示例:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
# 加载数据
iris = load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 创建分类器
clf = RandomForestClassifier(n_estimators=100)
# 训练模型
clf.fit(X_train, y_train)
# 预测结果
y_pred = clf.predict(X_test)
# 评估模型
score = clf.score(X_test, y_test)
print(f"模型准确率:{score:.2f}")
资源
更多关于 Scikit-Learn 的信息,您可以访问 Scikit-Learn 官方文档。
Scikit-Learn Logo