数千〜数万の小さなコアを同時に動かし、大量の行列演算をまとめて処理します。深層学習では学習・推論の両方でこの並列処理が要となります。
数千〜数万の小さなコアを同時に動かし、大量の行列演算をまとめて処理します。深層学習では学習・推論の両方でこの並列処理が要となります。
クラウドで AI モデルを動かすとき「GPU インスタンス」という形で登場します。料金表に「A100 × 8 枚」「H100 × 4 枚」のような記載や「GPU 不足」という文脈でよく目にします。
大量の行列演算を並列に処理する演算装置です。
AI 学習・推論を CPU より数十〜百倍速く実行できます。
GPU メモリ(VRAM)が不足するとモデルが動かないことがあります。
深層学習の学習・推論・画像生成の全工程で必要です。
CPU との違いと「並列処理が得意」な理由の把握が出発点です。
VRAM、CUDA、Tensor コア、H100、FLOPS。