卷积神经网络（CNN）模型架构详解 🧠

卷积神经网络（Convolutional Neural Network）是深度学习中用于图像识别的主流架构，其核心思想通过局部感知和权值共享提取空间特征。以下是其典型结构：

1. 核心组件解析

卷积层(Convolutional Layer)
使用滤波器（kernel）扫描输入数据，生成特征图（Feature Map）。
激活函数(Activation Function)
常用ReLU（Rectified Linear Unit）引入非线性，提升模型表达能力
池化层(Pooling Layer)
通过最大池化（Max Pooling）或平均池化降低数据维度，保留关键特征
全连接层(Fully Connected Layer)
最终将特征图展平并接入全连接网络，输出分类结果

2. 典型架构流程

输入层接收图像数据
卷积层提取局部特征
激活函数增强非线性表达
池化层进行特征降维
多层堆叠形成深度结构
全连接层输出最终预测

3. 应用场景

图像分类（如MNIST手写数字识别）
目标检测（如YOLO算法）
图像分割（如U-Net架构）
特征提取（如预训练模型迁移学习）

4. 学习资源

5. 拓展思考

如何设计卷积核尺寸与步长？
池化层对模型性能的影响？
现代CNN的改进方向（如残差网络、Transformer融合）？

CNN架构示意图