Logistic 回归是一种用于二分类问题的统计方法。它通过建立逻辑回归模型,预测目标变量属于某一类的概率。

基本原理

Logistic 回归模型基于以下公式:

$$ P(Y=1|X) = \frac{1}{1 + e^{-(\beta_0 + \beta_1 X_1 + \beta_2 X_2 + ... + \beta_n X_n)}} $$

其中,$ P(Y=1|X) $ 表示在给定特征 $ X $ 的情况下,目标变量 $ Y $ 属于 1 的概率。$ \beta_0, \beta_1, \beta_2, ..., \beta_n $ 是模型的参数,需要通过训练数据学习得到。

应用场景

Logistic 回归在许多领域都有广泛的应用,例如:

  • 预测客户流失
  • 信贷评分
  • 医疗诊断
  • 股票市场预测

示例

以下是一个简单的例子,演示了如何使用 Python 和 scikit-learn 库实现 Logistic 回归:

from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 示例数据
X = [[1, 2], [2, 3], [3, 4], [4, 5], [5, 6]]
y = [0, 0, 0, 1, 1]

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建 Logistic 回归模型
model = LogisticRegression()

# 训练模型
model.fit(X_train, y_train)

# 预测测试集
y_pred = model.predict(X_test)

# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

扩展阅读

更多关于 Logistic 回归的内容,可以参考以下链接:

Logistic Regression