Scikit-learn 是一个开源的机器学习库,旨在提供简单、高效的工具,以便于数据科学家进行数据挖掘和数据分析。它包含了大量的机器学习算法,涵盖了分类、回归、聚类等常见任务。

主要功能

  • 分类:支持多种分类算法,如逻辑回归、决策树、支持向量机等。
  • 回归:包括线性回归、岭回归、Lasso回归等。
  • 聚类:包括K均值、层次聚类等。
  • 降维:如主成分分析(PCA)和因子分析。
  • 模型选择:提供交叉验证和网格搜索等功能,帮助选择最佳的模型和参数。

安装

pip install scikit-learn

示例

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier


iris = load_iris()
X, y = iris.data, iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 创建随机森林分类器
clf = RandomForestClassifier()

# 训练模型
clf.fit(X_train, y_train)

# 评估模型
score = clf.score(X_test, y_test)
print(f"模型准确率:{score:.2f}")

更多关于 Scikit-learn 的使用示例,请参考我们的官方文档

相关资源

希望这个页面能帮助您更好地了解 Scikit-learn!😊

Scikit-learn Logo