Scikit-learn 是一个开源的机器学习库,用于 Python 语言。它提供了许多机器学习算法的实现,包括分类、回归、聚类、降维等。
快速开始
以下是一些 Scikit-learn 的基本使用方法:
安装:首先,您需要安装 Scikit-learn。可以通过以下命令进行安装:
pip install scikit-learn
导入:在您的 Python 代码中,首先需要导入 Scikit-learn:
from sklearn import datasets
加载数据:Scikit-learn 提供了许多常用的数据集,例如:
iris = datasets.load_iris()
训练模型:使用训练数据来训练一个模型:
from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=42) clf = RandomForestClassifier() clf.fit(X_train, y_train)
评估模型:使用测试数据来评估模型的性能:
from sklearn.metrics import accuracy_score y_pred = clf.predict(X_test) print("Accuracy:", accuracy_score(y_test, y_pred))
资源
如果您想了解更多关于 Scikit-learn 的信息,以下是一些有用的资源: