DoubleR的博客
04
11
07
深度学习-注意力机制 深度学习-注意力机制
前言上一章我们为逐步了解了Transformer内部运作机理开了个头,这是大语言模型的核心技术之一,也广泛应用于现代AI热潮中的其它工具。它首次出现于2017年一篇论文《Attention is All You Need》。因此本章将深入讨
2026-04-07
03
01
2 / 3