什么是RNN?

RNN(Recurrent Neural Network)是一种处理序列数据的神经网络,其核心在于通过循环结构捕捉时间依赖关系。
🧠 关键特点

  • 每个时间步共享权重参数
  • 能处理变长输入(如文本、语音)
  • 通过隐藏状态传递信息

核心公式

RNN的数学基础包括以下关键公式:

  1. 隐藏状态递推
    $$ h_t = \tanh(W_{hx}x_t + W_{hh}h_{t-1} + b_h) $$

    RNN_math
  2. 输出计算
    $$ o_t = W_{oh}h_t + b_o $$
    (输出层通常通过softmax或线性激活函数生成)

  3. 反向传播算法
    使用**BPTT(Back Propagation Through Time)**进行训练,解决梯度消失/爆炸问题。

结构图示

RNN_cell_structure
图中展示了RNN的循环单元,包含输入门、遗忘门和输出门(如LSTM结构)。

应用场景

自然语言处理(NLP):文本生成、机器翻译
时间序列预测:股票价格、天气数据
语音识别:音频信号处理

扩展阅读

想深入了解RNN的变体(如LSTM、GRU)?
👉 点击此处查看RNN进阶教程


图片关键词:RNN_math, Recurrent_Neural_Network