模型评估教程

模型评估是机器学习流程中的重要环节，它帮助我们了解模型的性能和泛化能力。以下是一些关于模型评估的基本概念和常用方法。

常用评估指标

准确率（Accuracy）：模型预测正确的样本占总样本的比例。
召回率（Recall）：模型正确预测的样本占实际正例样本的比例。
精确率（Precision）：模型预测正确的样本占预测为正例的样本的比例。
F1 分数（F1 Score）：精确率和召回率的调和平均数。

评估方法

交叉验证（Cross-Validation）：将数据集分为 k 个子集，轮流使用 k-1 个子集作为训练集，剩下的一个子集作为验证集，重复这个过程 k 次，最终取平均结果。
留出法（Hold-Out）：将数据集随机分为训练集和验证集，通常训练集占 70%，验证集占 30%。
分层采样（Stratified Sampling）：在数据集划分过程中保持类别比例。

实践案例

以下是一个使用 Python 进行模型评估的示例：

from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 假设 X 是特征数据，y 是标签数据
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 训练模型
model.fit(X_train, y_train)

# 预测
y_pred = model.predict(X_test)

# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

扩展阅读

更多关于模型评估的内容，可以参考以下链接：

机器学习模型评估