LLM(大規模言語モデル)は文章を文字単位ではなくトークン(Token)という塊で処理します。1 トークンはおよそ英語 4 文字・日本語 1〜2 文字が目安で、処理量と料金の計算単位です。
LLM(大規模言語モデル)は文章を文字単位ではなくトークン(Token)という塊で処理します。1 トークンはおよそ英語 4 文字・日本語 1〜2 文字が目安で、処理量と料金の計算単位です。
API の利用ダッシュボードで「X tokens used」と表示されるのが初対面です。Context Window の上限も「〇〇K トークン」と表記されるため、長い会話や大量ファイルを扱うときに意識します。
LLM が処理する情報量を数える最小単位です。
トークン数を意識すると、Context の使い方と費用を見通せます。
日本語は英語より同文でもトークン数が多くなることがあります。
長文処理や多ファイル読込で Context が詰まる前に気づけます。
「1 トークン ≒ 英語 4 文字・日本語 1〜2 文字」という感覚を掴むことです。
Context Window、Prompt Engineering、料金プラン(B-50〜52)。