4つのAIコーディングエージェントにマインスイーパの再構築を依頼した結果は爆発的だった
概要
Ars Technicaは、OpenAIのCodex、AnthropicのClaude Code (Opus 4.5)、GoogleのGemini CLI、Mistral Vibeという4つのAIコーディングエージェントをテストし、機能が充実し、モバイル対応で、さらに楽しい新機能が組み込まれたクラシックゲーム「マインスイーパ」のウェブ版を再現するよう依頼しました。このテストは、人間のデバッグなしの「シングルショット」で行われました。OpenAI Codexが9/10で最高評価を獲得しました。これは、重要な「連打(chording)」機能を実装し、モバイルでの操作性も最も優れていたためです。Anthropic Claude Codeは2位(7/10)で、コード生成速度が最も速く、プレゼンテーションも洗練されていましたが、決定的な連打機能が欠けていました。Mistral Vibeは4/10と低評価で、連打機能や効果音が欠落していましたが、虹色の背景がささやかな「楽しい」要素となりました。Google Gemini CLIは完全に失敗(0/10)し、音響効果や依存関係の問題で動作するコードを生成できませんでした。結論として、AIエージェントはある程度の能力を示していますが、現時点では人間のスキルを補完するツールとして機能するのが最適であると示唆されています。
(出典:Ars Technica)