Logistic 回归是一种用于二分类问题的统计方法。它通过建立逻辑回归模型,预测目标变量属于某一类的概率。
基本原理
Logistic 回归模型基于以下公式:
$$ P(Y=1|X) = \frac{1}{1 + e^{-(\beta_0 + \beta_1 X_1 + \beta_2 X_2 + ... + \beta_n X_n)}} $$
其中,$ P(Y=1|X) $ 表示在给定特征 $ X $ 的情况下,目标变量 $ Y $ 属于 1 的概率。$ \beta_0, \beta_1, \beta_2, ..., \beta_n $ 是模型的参数,需要通过训练数据学习得到。
应用场景
Logistic 回归在许多领域都有广泛的应用,例如:
- 预测客户流失
- 信贷评分
- 医疗诊断
- 股票市场预测
示例
以下是一个简单的例子,演示了如何使用 Python 和 scikit-learn 库实现 Logistic 回归:
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 示例数据
X = [[1, 2], [2, 3], [3, 4], [4, 5], [5, 6]]
y = [0, 0, 0, 1, 1]
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建 Logistic 回归模型
model = LogisticRegression()
# 训练模型
model.fit(X_train, y_train)
# 预测测试集
y_pred = model.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
扩展阅读
更多关于 Logistic 回归的内容,可以参考以下链接:
Logistic Regression