optimization_tips/learning_rate

学习率优化技巧 📈

学习率是训练神经网络时最关键超参数之一，以下是一些实用建议：

1. 学习率衰减策略 📉

指数衰减：lr = initial_lr * decay_rate^step
余弦退火：通过周期性调整学习率提升收敛速度
自定义衰减：根据验证集表现动态调整学习率

2. 自适应学习率算法 🧠

Adam：结合动量与RMSProp，适合非稳态目标函数
RMSProp：通过平方梯度平滑波动，缓解震荡问题
Adagrad：自动调整学习率，适合稀疏数据

3. 学习率调度器应用 ⏱️

使用 torch.optim.lr_scheduler（PyTorch）或 tf.keras.callbacks.LearningRateScheduler（TensorFlow）
推荐参考：学习率调度器详解

4. 实践建议 ✅

初始值建议在 1e-3 到 1e-5 范围
避免学习率过大导致训练不稳定（爆炸）或过小导致收敛缓慢（停滞）
可结合早停机制优化训练效率

📌 小贴士：学习率调整需结合具体任务与数据集，建议通过实验验证效果！