Transformer 简介

Transformer 是一种基于自注意力机制的深度神经网络模型，它彻底改变了自然语言处理（NLP）领域。自 2017 年提出以来，Transformer 模型在许多 NLP 任务上都取得了显著的成果，如机器翻译、文本摘要、问答系统等。

特点

自注意力机制：Transformer 使用自注意力机制来捕捉输入序列中的长距离依赖关系。
编码器-解码器结构：Transformer 采用编码器-解码器结构，能够处理序列到序列的任务。
并行计算：Transformer 可以并行计算，提高了模型的训练速度。

应用

机器翻译：Transformer 在机器翻译任务上取得了显著的成果，如 Google 的神经机器翻译系统。
文本摘要：Transformer 可以用于提取长文本的摘要。
问答系统：Transformer 可以用于构建问答系统，如 DuReader。

扩展阅读

更多关于 Transformer 的内容，您可以阅读以下文章：

Transformer 模型结构图