Logistic Regression 机器学习教程

Logistic Regression 是一种广泛使用的分类算法，它用于预测二元结果。本文将为您介绍 Logistic Regression 的基本概念、原理以及如何使用 Python 进行实现。

基本概念

Logistic Regression 是一种概率型线性回归模型，用于预测一个类别变量。它假设因变量 Y 和自变量 X 之间存在某种线性关系，并通过最大似然估计来找到最佳拟合线。

原理

Logistic Regression 的核心是 Sigmoid 函数，它可以将线性模型的输出压缩到 0 和 1 之间，表示事件发生的概率。

Sigmoid 函数公式如下：

σ(z) = 1 / (1 + e^(-z))

其中，z 是线性模型的输出。

Python 实现

以下是一个使用 Python 和 scikit-learn 库实现 Logistic Regression 的简单例子：

from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 数据准备
X = [[1, 2], [2, 3], [3, 4], [4, 5], [5, 6]]
y = [0, 0, 0, 1, 1]

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 创建 Logistic Regression 模型
model = LogisticRegression()

# 训练模型
model.fit(X_train, y_train)

# 预测
y_pred = model.predict(X_test)

# 评估模型
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")

扩展阅读

如果您想了解更多关于 Logistic Regression 的内容，可以阅读以下教程：

Scikit-learn 官方文档 - Logistic Regression

希望这篇文章能帮助您更好地理解 Logistic Regression。如果您有任何疑问，欢迎在评论区留言。