什么是深度学习?
深度学习是机器学习的一个分支,通过多层神经网络模拟人脑处理数据的方式。其核心在于从数据中自动学习特征层级,例如:
- 输入层:接收原始数据(如图像、文本)
- 隐藏层:通过非线性变换提取抽象特征
- 输出层:生成最终预测结果(如分类标签)
核心概念速览
概念 | 说明 | 示例 |
---|---|---|
激活函数 | 用于引入非线性,如ReLU、Sigmoid | f(x) = max(0, x) |
损失函数 | 衡量预测与真实值的差距,如交叉熵 | L = -Σ y_i log(p_i) |
优化算法 | 通过梯度下降调整参数,如Adam | θ_{t+1} = θ_t - α∇L(θ_t) |