音声ファイルをテキストに変換します。99 言語の文字起こしと翻訳に対応し、ローカル環境でも動かせます。whisper.cpp を使うと CPU だけで軽量推論できます。
音声ファイルをテキストに変換します。99 言語の文字起こしと翻訳に対応し、ローカル環境でも動かせます。whisper.cpp を使うと CPU だけで軽量推論できます。
会議録や動画の字幕生成を自動化したいときに名前が出ます。音声系サービスの内部でも採用されており、API 経由で自前アプリに組み込む場面でも登場します。
音声をテキストへ変換するオープンな基盤モデルです。
無償・ローカル動作可能で、商用利用も許可されています。
精度は音質や話速によって変わることがあります。
議事録自動化や動画字幕生成など音声テキスト化の場面。
API 利用とローカル実行(whisper.cpp)の 2 択を把握します。
OpenAI API、whisper.cpp、Dictation(G-3)。