一般語彙

Attention

アテンション

Transformer の核。入力のどの単語に注目するかを重みで計算する仕組みです。

体験区分：調査ベース推奨読者レベル：Level 3

文中の各単語が他のどの単語と関係深いかを数値の重みで表します。Query（問い合わせ）・Key（索引）・Value（値）を掛け合わせて計算し、重要な単語ほど強く参照します。

AI モデルの解説記事で「Self-Attention」「Multi-Head Attention」の形で目にします。ChatGPT や Claude が長い文脈を掴めるのも、この機構が並列計算で文全体を一度に処理するためです。

イメージ

開発フローでの位置

入力のトークン化

→

Attention の計算

→

重みづけ集約

→

多層スタック

→

出力生成

2026.04·ready

「Attention が文脈の鍵で、Query と Key の組み合わせで重みが変わるんですよね。」

Attentionの見方

575

この用語の見どころ

役割

文中の単語どうしの関係強度を数値の重みで計算します。

うれしさ

全単語を並列処理できるため、長い文脈も落とさず扱えます。

注意点

仕組みの詳細より「何に注目するか」の概念把握が先決です。

どこで役立つか

LLM の動作原理を理解したいときの最初の足がかりになります。

はじめに

Query・Key・Value の 3 語と「重みで参照する」イメージで十分です。

深掘り先

Transformer（J-13）、LLM（J-14）、Deep Learning（J-11）

非エンジニアのつまずき

私のコメント