id: D-71(誌面表示: D-71) · 物理ページ: 228–229(pages=2) · category: model · figure_type: workflow · status: ready · evaluation_date: 2026-04-29
tagline 54/25-45 ↑9何を 80/60-200どこで 74/60-200会話例 35/25-50見1 25/15-40見2 27/15-40見3 23/15-40見4 26/15-40見5 35/15-40見6 37/15-50
← D-70 Amical 目次 E-01 SWE-Bench →
モデル
228

Whisper

ウィスパー
OpenAI が公開した音声認識モデルです。99 言語に対応し、Apache 2.0 ライセンスで無償利用できます。
体験区分:少しだけ触った 推奨読者レベル:Level 3

何をしてくれるか

音声ファイルをテキストに変換します。99 言語の文字起こしと翻訳に対応し、ローカル環境でも動かせます。whisper.cpp を使うと CPU だけで軽量推論できます。

どこで出会うか

会議録や動画の字幕生成を自動化したいときに名前が出ます。音声系サービスの内部でも採用されており、API 経由で自前アプリに組み込む場面でも登場します。

ワークフロー図
2026.04·ready
「議事録は Whisper を API で呼んで文字起こしするのが手軽です。」
Whisperの見方
229
この用語の見どころ
1
役割

音声をテキストへ変換するオープンな基盤モデルです。

2
うれしさ

無償・ローカル動作可能で、商用利用も許可されています。

3
注意点

精度は音質や話速によって変わることがあります。

4
どこで役立つか

議事録自動化や動画字幕生成など音声テキスト化の場面。

5
はじめに

API 利用とローカル実行(whisper.cpp)の 2 択を把握します。

6
深掘り先

OpenAI API、whisper.cpp、Dictation(G-3)。

非エンジニアのつまずき
  • OpenAI が ChatGPT 以外もやっているのに、あまり有名ではないです。
  • 実際にどうやって入れて、どのタイミングで使えばよいのかが分かりづらいです。
私のコメント
  • 第一印象:OSS で使えるという点に好感があります。
  • 良い点:組み込みシステムとして成立させられます。
  • ダメな点:モデルが大きく基本ローカル前提、API 利用は課金が嵩みます。
  • 誰向けか:自分でローカルに入れて使う人向け。裏側で動く例もありそうです。
開発フローでの位置
音声ファイルを準備する
実行方法を選ぶ
モデルに渡す
テキストを受け取る
関連用語
参考 openai.com/research/whisper checked 2026-04-29
D-71·model
バイブコーディング図鑑