AI モデルは更新のたびにコスト削減や安全対策が加わり、ユーザーが「以前より回答が雑になった」と感じることがあります。この体感を一言で表す言葉が「ナーフされた」という表現です。
AI モデルは更新のたびにコスト削減や安全対策が加わり、ユーザーが「以前より回答が雑になった」と感じることがあります。この体感を一言で表す言葉が「ナーフされた」という表現です。
SNS やコミュニティで「最近 ChatGPT が使えない」「Claude がナーフされてる」という投稿で目にします。提供側は「ベンチ上の変化はない」と説明しますが、体感との溝が埋まりにくいです。
ユーザー体感とベンチ評価のズレを指す共通語です。
「なんか悪くなった」という曖昧な感覚に名前が付きます。
体感とスコアは別物で、主観バイアスが混じりやすいです。
モデル選定や切り替え判断の会話で登場します。
ゲーム由来の比喩語と知っておくと文脈が追いやすいです。
Quantization、Chatbot Arena、SWE-Bench