一般語彙

拡散モデル

かくさんモデル

Diffusion Model とも呼ばれる画像・動画生成の主流技術です。ノイズを段階的に除去して像を作ります。

体験区分：調査ベース推奨読者レベル：Level 3

ランダムなノイズから少しずつ除去する「逆拡散」プロセスで画像や動画を生成します。テキスト条件付けを組み合わせると指示文から絵を描く AI の核になります。

Stable Diffusion・DALL-E・Sora など画像・動画生成の解説記事で目にします。LLM と並ぶ「現代生成 AI の二大アーキテクチャ」として紹介されます。

イメージ

開発フローでの位置

モデル選定

→

テキスト条件の設計

→

推論実行

→

品質確認

→

応用実装

2026.04·ready

「Stable Diffusion は拡散モデルベースで、ノイズ除去を繰り返して画像を作ります。」

拡散モデルの見方

585

この用語の見どころ

役割

ノイズを段階的に除去して画像・動画・音声を生成するアーキテクチャです。

うれしさ

高品質な画像を多様に生成でき、テキスト指示にも対応できます。

注意点

複数ステップかかるため単純な推論より処理が重くなります。

どこで役立つか

画像・動画生成ツールの仕組みを概念として理解したい場面で役立ちます。

はじめに

「ノイズから絵を取り出す逆向きの処理」という大枠で十分です。

深掘り先

Stable Diffusion（D-54）、DDPM 論文、U-Net

非エンジニアのつまずき

私のコメント