GPT-1(2018年)は「事前学習+微調整」という現在の主流パラダイムを確立しました。GPT-2(2019年)はゼロショット学習を示し、規模が増すほど性能が伸びることを実証しています。
GPT-1(2018年)は「事前学習+微調整」という現在の主流パラダイムを確立しました。GPT-2(2019年)はゼロショット学習を示し、規模が増すほど性能が伸びることを実証しています。
AI 史の説明文脈で登場します。「なぜ今のモデルはこれほど賢いのか」を辿ると、必ずこの世代に行き着きます。GPT-2 の段階公開は AI 安全性の先例として今も引用されます。
現代 LLM の原型。事前学習+微調整の枠組みを確立しました。
Scaling Law の起点を知ると現在のモデル競争の理由が腑に落ちます。
廃止済みで実用では使いません。歴史知識として扱います。
AI 開発の経緯や大規模化の背景を説明する場面。
GPT-1 論文の「事前学習+微調整」という概念が核心です。
GPT-3 系、Transformer 論文、Scaling Law