梯度下降算法详解 📚

梯度下降（Gradient Descent）是机器学习中用于优化模型参数的核心算法之一，通过迭代计算损失函数的梯度并沿负方向更新参数，最终逼近最优解。以下是关键知识点：

基本原理 🔍

数学公式
参数更新规则：
$$ \theta_{t+1} = \theta_t - \eta \nabla J(\theta_t) $$
其中 $\eta$ 为学习率，$\nabla J(\theta_t)$ 为损失函数 $J$ 在参数 $\theta_t$ 处的梯度。
核心思想
- 沿着损失函数的负梯度方向移动，逐步减小误差
- 学习率控制更新步长，过大可能导致震荡，过小则收敛缓慢

📝 提示：理解梯度下降需要先掌握微积分中的导数概念，建议结合可视化工具（如Matplotlib）加深理解。