id: G-46(誌面表示: G-46) · 物理ページ: 494–495(pages=2) · category: term_llm · figure_type: comparison · status: ready · evaluation_date: 2026-04-30
tagline 57/25-45 ↑12何を 87/60-200どこで 94/60-200会話例 34/25-50見1 24/15-40見2 27/15-40見3 27/15-40見4 22/15-40見5 27/15-40見6 35/15-50
← G-44 マルチエージェント協調 目次 G-47 Auto-compact →
バイブ特有
494

ナーフ

モデルの劣化体感
ゲーム用語で強キャラを弱体化する調整のこと。AI 文脈では「更新後にモデルが弱まった気がする」という体感を指します。
体験区分:少しだけ触った 推奨読者レベル:Level 2-4

何をしてくれるか

AI モデルは更新のたびにコスト削減や安全対策が加わり、ユーザーが「以前より回答が雑になった」と感じることがあります。この体感を一言で表す言葉が「ナーフされた」という表現です。

どこで出会うか

SNS やコミュニティで「最近 ChatGPT が使えない」「Claude がナーフされてる」という投稿で目にします。提供側は「ベンチ上の変化はない」と説明しますが、体感との溝が埋まりにくいです。

比較図
2026.04·ready
「最近 Claude ナーフされたのか、長文の精度が落ちた気がします。」
ナーフ(モデルの劣化体感)の見方
495
この用語の見どころ
1
役割

ユーザー体感とベンチ評価のズレを指す共通語です。

2
うれしさ

「なんか悪くなった」という曖昧な感覚に名前が付きます。

3
注意点

体感とスコアは別物で、主観バイアスが混じりやすいです。

4
どこで役立つか

モデル選定や切り替え判断の会話で登場します。

5
はじめに

ゲーム由来の比喩語と知っておくと文脈が追いやすいです。

6
深掘り先

Quantization、Chatbot Arena、SWE-Bench

非エンジニアのつまずき
  • ゲーム界隈ではおなじみだが、そうでない人には語源も伝わらない。
  • 安全性強化でモデルが下方修正され、認識の差で話がかみ合わない場面がある。
私のコメント
  • 第一印象:最初は意味が分からなかった。
  • 良い点:ネットスラングベースだが、結構使いやすい。
  • ダメな点:所詮スラングなので、公式な場では使いづらい。
  • 誰向けか:AI 界隈との雑談で面白い話として回せる場面で活きる。
開発フローでの位置
モデル選定
更新通知の受信
体感の変化に気づく
ベンチとの照合
運用判断
関連用語
参考 (未記入) checked —
G-46·term_llm
バイブコーディング図鑑