OpenAI、ゴブリンについて話さないことについて語る

The Verge
OpenAIは、強化学習の影響でAIモデルがゴブリンや小鬼について言及する癖がついてしまった経緯を説明しました。

概要

OpenAIは、同社のAIモデルがゴブリンやグレムリンといった架空の生物について頻繁に言及するようになった現象について説明しました。この問題は、GPT-5.1の「Nerdy(オタク的)」な性格設定において、強化学習がこれらの比喩を誤って高く評価したことに端を発しています。強化学習による学習行動は他のモデルにも波及しやすいため、当該性格設定を廃止した後も癖が残る結果となりました。OpenAIは最終的にCodexに対して明示的な禁止命令を出すことで対処しましたが、ユーザーが意図的にゴブリンの言及を有効化できるよう設定も公開しています。

(出典:The Verge)