id: J-70(誌面表示: J-70) · 物理ページ: 608–609(pages=2) · category: term_general · figure_type: comparison · status: ready · evaluation_date: 2026-04-29
tagline 48/25-45 ↑3何を 78/60-200どこで 59/60-200 ↓1会話例 45/25-50見1 29/15-40見2 30/15-40見3 32/15-40見4 32/15-40見5 33/15-40見6 32/15-50
← J-56 GDPR 目次 J-71 RAM →
一般語彙
608

VRAM

ブイラム
Video RAM の略。GPU に直結した高速メモリで、LLM 推論時にモデルパラメータを格納します。
体験区分:調査ベース 推奨読者レベル:Level 3-4

何をしてくれるか

GPU が計算に使うデータを保持するメモリです。LLM 推論ではモデルパラメータ・中間活性・KV キャッシュをここに置きます。容量が不足するとモデルが動きません。

どこで出会うか

ローカル LLM を試すときに最初にぶつかる制約です。「このモデルは VRAM 何 GB 必要?」という確認がスタートになります。

比較図
2026.04·ready
「RTX 5090 の 32GB VRAM だと、4bit 量子化の 70B モデルがギリ動く感じです。」
VRAMの見方
609
この用語の見どころ
1
役割

GPU が推論に使うパラメータ・KV キャッシュを保持します。

2
うれしさ

容量を把握すれば、動かせるモデルの上限を事前に計算できます。

3
注意点

CPU のシステムメモリ(RAM)とは独立した GPU 専用領域です。

4
どこで役立つか

ローカル LLM の選定や、API 利用か自前推論かの判断に使います。

5
はじめに

「モデルサイズ × 量子化精度 = 必要 VRAM」の目安計算を押さえます。

6
深掘り先

GPU(J-77)、パラメータ数(J-22)、量子化(J-19)

非エンジニアのつまずき
  • コンシューマー GPU だとフロンティアモデルが載りきらない理由がここに集約されます。
  • Mac 開発者が多いのは RAM と VRAM を共通化してコスパが良いからです。
私のコメント
  • 第一印象:メモリにも色々あるんだな、と知る入口でした
  • 良い点:GPU の性能を「動くかどうか」で単純に評価できる指標になる点
  • ダメな点:そもそも動かない、という制約はやはり厳しいです
  • 誰向けか:ローカル llm 試す人は必須かな
開発フローでの位置
モデル選定
VRAM 試算
環境確認
実行判断
推論実行
関連用語
参考 (未記入) checked —
J-70·term_general
バイブコーディング図鑑