什么是RNN?
循环神经网络(Recurrent Neural Network)是一种专为处理序列数据设计的神经网络,通过时间序列的递归结构捕捉数据中的时序依赖关系。
RNN的核心特性
- 记忆能力:通过隐藏状态(hidden state)保留历史信息,用 ⬇️ 表示信息传递
- 变长输入:可处理任意长度的序列(如文本、语音)
- 序列生成:适用于自然语言处理、机器翻译等任务
典型应用场景
• 文本生成(如诗歌、对话)
• 机器翻译(序列到序列模型)
• 时间序列预测(股票价格、天气)
• 视频分析(帧间依赖)
RNN的变体
- LSTM(长短期记忆网络):解决梯度消失问题,用 🧠 表示记忆单元
- GRU(门控循环单元):简化LSTM结构,提升训练效率
- 双向RNN:同时利用序列前后文信息,用 🔄 表示双向流动