PyTorch 内存管理指南 📈

PyTorch 内存管理是高效使用深度学习资源的关键技能，尤其在处理大规模数据时。以下为核心要点与实用技巧：

1. 内存分配与释放

动态内存管理：PyTorch 使用 torch.cuda 或 torch.device 控制显存分配，避免内存泄漏。
显存监控工具：使用 torch.cuda.memory_summary() 实时查看显存使用情况。
手动释放：通过 .detach() 或 del 删除无用张量，触发垃圾回收。

2. 优化实践

小批量训练：减少 batch_size 以降低显存占用，但需权衡训练效率。
模型剪枝：使用 torch.nn.utils.prune 剪枝冗余参数，节省内存。
混合精度训练：通过 torch.cuda.amp 实现混合精度，减少显存消耗。

3. 工具与库

PyTorch Profiler：分析内存使用与计算图，定位瓶颈。
DataLoader：合理设置 num_workers 与 pin_memory，优化数据加载效率。
内存泄漏排查：使用 torch.utils.checkpoint 或工具链 tracemalloc 跟踪内存占用。

4. 常见问题

显存不足：检查是否重复保存中间张量，或尝试使用 torch.cuda.empty_cache()。
内存泄漏：确保模型和数据在训练后被正确释放，避免长期占用。

如需进一步学习 PyTorch 基础知识，可访问 PyTorch 入门教程。