什么是神经网络?
神经网络(Neural Network)是受生物神经系统启发的计算模型,通过层叠的节点(神经元)模拟数据处理过程。其核心思想是通过权重调整和非线性激活函数,让模型自动学习数据特征。
🔢 基本组成
- 输入层:接收原始数据(如图像像素、文本向量)
- 隐藏层:通过加权求和与激活函数提取特征
- 输出层:生成最终预测结果(如分类标签)
- 权重参数:连接节点的可学习系数(通过训练不断优化)
📌 核心原理
前向传播
数据从输入层逐层传递至输出层,每层计算公式为:
$$ z = W \cdot x + b,\quad a = \sigma(z) $$
其中 $ \sigma $ 是激活函数(如 Sigmoid、ReLU)。损失函数
用于衡量预测结果与真实标签的差距,常见类型包括:- 均方误差(MSE)
- 交叉熵损失(Cross-Entropy)
- 对数损失(Log Loss)
反向传播算法
通过链式法则计算梯度,调整权重参数以最小化损失。关键步骤:- 计算损失对权重的梯度
- 使用优化器(如 SGD、Adam)更新参数
- 反向传播公式:$$ \frac{\partial L}{\partial W} = \frac{\partial L}{\partial a} \cdot \frac{\partial a}{\partial z} \cdot \frac{\partial z}{\partial W} $$
🧩 实例演示
感知机(Perceptron):最简单的神经网络模型
多层感知机(MLP):包含多个隐藏层的结构
卷积神经网络(CNN):专门处理图像数据
📚 扩展学习
🌟 应用场景
- 图像分类(如 MNIST 数据集)
- 自然语言处理(如情感分析)
- 语音识别
- 强化学习(如游戏AI)
通过不断训练和调整参数,神经网络可以逼近复杂的函数关系,成为现代AI的核心技术。