什么是神经网络?

神经网络(Neural Network)是受生物神经系统启发的计算模型,通过层叠的节点(神经元)模拟数据处理过程。其核心思想是通过权重调整非线性激活函数,让模型自动学习数据特征。

🔢 基本组成

  • 输入层:接收原始数据(如图像像素、文本向量)
  • 隐藏层:通过加权求和与激活函数提取特征
  • 输出层:生成最终预测结果(如分类标签)
  • 权重参数:连接节点的可学习系数(通过训练不断优化)

📌 核心原理

  1. 前向传播
    数据从输入层逐层传递至输出层,每层计算公式为:
    $$ z = W \cdot x + b,\quad a = \sigma(z) $$
    其中 $ \sigma $ 是激活函数(如 Sigmoid、ReLU)。

  2. 损失函数
    用于衡量预测结果与真实标签的差距,常见类型包括:

    • 均方误差(MSE)
    • 交叉熵损失(Cross-Entropy)
    • 对数损失(Log Loss)
  3. 反向传播算法
    通过链式法则计算梯度,调整权重参数以最小化损失。关键步骤:

    • 计算损失对权重的梯度
    • 使用优化器(如 SGD、Adam)更新参数
    • 反向传播公式:$$ \frac{\partial L}{\partial W} = \frac{\partial L}{\partial a} \cdot \frac{\partial a}{\partial z} \cdot \frac{\partial z}{\partial W} $$

🧩 实例演示

  • 感知机(Perceptron):最简单的神经网络模型

    感知机
  • 多层感知机(MLP):包含多个隐藏层的结构

    多层感知机
  • 卷积神经网络(CNN):专门处理图像数据

    卷积神经网络

📚 扩展学习

🌟 应用场景

  • 图像分类(如 MNIST 数据集)
  • 自然语言处理(如情感分析)
  • 语音识别
  • 强化学习(如游戏AI)

通过不断训练和调整参数,神经网络可以逼近复杂的函数关系,成为现代AI的核心技术。