这是我用 PyTorch 实现 NLP 领域经典模型 Transformer 的项目代码。 为了更好地理解 Transformer 的网络架构,欢迎访问我的博客深入浅出Transformer,希望这能给你一些帮助。 项目背景 这个项目的目的是帮助我更好的了解 Transformer 的网络架构和诸如多头自注意力、位置 ...