LLM(大規模言語モデル)が 1 回の推論で参照できるトークン数の上限です。指示・会話履歴・添付ファイルはこの枠に収まる範囲でしか見えません。
LLM(大規模言語モデル)が 1 回の推論で参照できるトークン数の上限です。指示・会話履歴・添付ファイルはこの枠に収まる範囲でしか見えません。
API ドキュメントやモデル比較表に「128K」「200K」「1M」と表記されます。「入力が長すぎる」とエラーが出るのは、Context Window の上限を超えた場合です。
LLM が一度に見られる情報量の上限を示す枠です。
上限が広いほど長文書類や複数ファイルを分割せず渡せます。
広くても中間部の情報は参照されにくくなることがあります。
長い仕様書・会話履歴・コードベースを一括で処理する場面です。
「〇〇K トークン」が枠の広さで、超えると情報が見えない点を押さえることです。
Context Engineering、RAG、Prompt Caching。