Attention だけで文章を処理する Transformer を提案した論文です。翌年に BERT・GPT-1 が登場し、LLM ブームの土台になっています。
Attention だけで文章を処理する Transformer を提案した論文です。翌年に BERT・GPT-1 が登場し、LLM ブームの土台になっています。
「現代 AI の起点」として技術記事や書籍で参照されます。ChatGPT や Claude の説明で「Transformer ベース」と出てきたら、この論文がもとです。
現代 LLM のアーキテクチャを定義した学術論文の起点です。
この 1 本で RNN から Transformer へのシフトが起きました。
論文自体は翻訳タスク向けで、LLM への応用は後から広がりました。
AI の歴史的文脈を理解したいときの最初の参照点になります。
タイトルと 2017 年公開という事実を押さえるだけで十分です。
Transformer(J-13)、Attention(J-17)、LLM(J-14)