什么是深度学习?
深度学习是机器学习的一个子领域,通过模拟人脑处理数据的方式,利用多层神经网络(Multi-Layer Neural Networks)实现复杂模式识别。其核心在于通过非线性变换提取数据特征,适用于图像识别、自然语言处理等场景。
神经网络结构
- 输入层:接收原始数据(如像素值)
- 隐藏层:通过权重和偏置进行特征提取(使用 神经网络结构 图解更清晰)
- 输出层:生成最终预测结果
核心概念
- 激活函数(如 📈ReLU、sigmoid)
- 用于引入非线性特性
- 示例:激活函数图解
- 损失函数(如 🔢MSE、CrossEntropy)
- 衡量模型预测与真实值的差距
- 常见类型:损失函数详解
- 反向传播(🔄Backpropagation)
- 通过梯度下降优化参数
- 过程演示:反向传播动画
常用框架
- PyTorch:动态计算图,适合研究
- TensorFlow:静态图,适合生产环境