ai/tutorials/nn/transformers

深度学习中的 Transformer 模型是一种革命性的架构，它改变了自然语言处理（NLP）的许多方面。下面是一些关于 Transformer 的基础教程和概念。

什么是 Transformer？

Transformer 是一种基于自注意力机制的深度神经网络模型，最初由 Google 在 2017 年提出，用于处理序列到序列的任务，如机器翻译。它主要由编码器和解码器两部分组成。

以下是一些关于 Transformer 的教程资源，可以帮助您更深入地了解这一主题：

希望这些资源能帮助您更好地理解 Transformer 模型。