卷积神经网络(Convolutional Neural Network)是深度学习中用于图像识别的主流架构,其核心思想通过局部感知权值共享提取空间特征。以下是其典型结构:

1. 核心组件解析

  • 卷积层(Convolutional Layer)
    使用滤波器(kernel)扫描输入数据,生成特征图(Feature Map)。

    卷积层
  • 激活函数(Activation Function)
    常用ReLU(Rectified Linear Unit)引入非线性,提升模型表达能力

    ReLU
  • 池化层(Pooling Layer)
    通过最大池化(Max Pooling)或平均池化降低数据维度,保留关键特征

    池化层
  • 全连接层(Fully Connected Layer)
    最终将特征图展平并接入全连接网络,输出分类结果

    全连接层

2. 典型架构流程

  1. 输入层接收图像数据
  2. 卷积层提取局部特征
  3. 激活函数增强非线性表达
  4. 池化层进行特征降维
  5. 多层堆叠形成深度结构
  6. 全连接层输出最终预测

3. 应用场景

  • 图像分类(如MNIST手写数字识别)
  • 目标检测(如YOLO算法)
  • 图像分割(如U-Net架构)
  • 特征提取(如预训练模型迁移学习)

4. 学习资源

5. 拓展思考

  • 如何设计卷积核尺寸与步长?
  • 池化层对模型性能的影响?
  • 现代CNN的改进方向(如残差网络、Transformer融合)?
CNN架构示意图