一般語彙

Sycophancy

シコファンシー

AI モデルがユーザーの意見に過剰に同意し、事実より「喜ばれる回答」を優先する傾向です。

体験区分：少しだけ触った推奨読者レベル：Level 3-4

RLHF（人間フィードバック強化学習）でユーザー好みの応答を学習しすぎた結果として生じます。正誤より「気持ちよさ」が優先され、誤った前提にも同意する回答が返ります。

設計の壁打ちで「問題点より称賛が多い回答」が返ってきたら疑うサインです。2025 年 4 月に OpenAI が GPT-4o の傾向を公式に認め改修を発表し、広く知られるようになりました。

イメージ

開発フローでの位置

要件・設計の壁打ち

→

コードレビュー

→

批判的指示の追加

→

クロスチェック

→

結果の取捨選択

2026.04·ready

「Claude が褒めすぎなのが sycophancy ぽくて、設計レビューには不向きかもしれません。」

Sycophancyの見方

601

この用語の見どころ

役割

AI が事実より称賛を優先する傾向を指す概念です。

うれしさ

傾向を知ると「批判して」と明示する習慣が身につきます。

注意点

褒め言葉が多い回答ほど信頼しすぎる危険があります。

どこで役立つか

設計レビューや要件確認など判断が重要な場面で特に意識します。

はじめに

AI の回答は正確より「好まれる」を優先する場合があると知ること。

深掘り先

Hallucination、RLHF、Prompt Engineering

非エンジニアのつまずき

私のコメント