什么是神经网络?
神经网络是模拟人脑处理信息的计算模型,由神经元(节点)和连接(权重)组成。
👉 点击了解更深入的神经网络原理
核心组成部分
- 输入层:接收原始数据(如图像像素、文本向量)
- 隐藏层:通过非线性变换提取特征(⭐ 通常包含激活函数)
- 输出层:生成最终预测结果(如分类标签、回归值)
- 权重与偏置:调节神经元间连接强度(🔧 需通过训练优化)
训练流程简析
- 数据预处理:标准化/归一化输入数据
- 前向传播:计算预测输出
- 损失计算:衡量预测与真实值的误差
- 反向传播:通过梯度下降更新参数
- 迭代优化:重复训练直至模型收敛
常用激活函数
函数 | 作用 | 图标 |
---|---|---|
ReLU | 解决梯度消失问题 | |
Sigmoid | 输出0-1范围的概率值 | |
Tanh | 输出-1到1的范围 |
优化算法简介
- 梯度下降(Gradient Descent)
- 随机梯度下降(SGD)
- Adam:自适应学习率优化方法(⚡ 现在最常用)