バイブ特有

指示追従性

LLM がプロンプトの細部まで忠実に従えるかを示す評価軸です。

体験区分：調査ベース推奨読者レベル：Level 3-4

「です・ます調で、箇条書き 5 つ以内にまとめて」のような複数条件付き指示を、どれだけ取りこぼさず実行できるかを測ります。モデルの品質比較や用途選定の基準として使われます。

LLM ベンチマーク記事やモデル比較表で「Instruction Following スコア」として目にします。プロンプトの条件が多いほど差が出やすく、実務でのモデル選びに直結する指標です。

比較図

2026.04·ready

「指示追従性が高いモデルほど、条件付きプロンプトの出力が安定しやすいです。」

指示追従性の見方

439

この用語の見どころ

役割

複数条件の指示をどれだけ忠実に実行できるかの評価軸です。

うれしさ

モデル選びの際に「複雑な指示への適性」を数値で比較できます。

注意点

スコアはプロンプト次第で変わるため、単一指標で過信しないことが大切です。

どこで役立つか

フォーマット固定や文体指定が多い業務でのモデル選定に役立ちます。

はじめに

IFEval などのベンチマーク名とセットで押さえると理解が早いです。

深掘り先

IFEval、MT-Bench、System Prompt

非エンジニアのつまずき

私のコメント

開発フローでの位置

要件整理

→

プロンプト設計

→

モデル比較

→

出力検証

→

運用調整