GeminiはChatGPTを超えたか?AIモデルをテストする。
概要
Ars Technicaは、AppleがSiriにGeminiを統合することを決定したことを受けて、Google Gemini (3.2 Fast)とOpenAI ChatGPT (5.2)のデフォルトの非サブスクリプションモデルを比較テストしました。評価は、ダジャレ、数学の問題、創作、伝記作成、困難なメール作成、医療アドバイス、ビデオゲームのガイダンス、緊急の飛行機着陸手順など、複雑なプロンプトを用いて行われました。Geminiは4つのプロンプト(数学、メール、伝記、ゲームのガイダンス)で勝利し、ChatGPTは3つ(ダジャレ、創作、飛行機着陸)で勝利、医療アドバイスは引き分けとなりました。Geminiがより多くのポイントを獲得しましたが、緊急着陸のシナリオではChatGPTの方が安全性を優先したため実用的であると見なされました。しかし、Geminiは情報タスクにおいて一般的に事実誤認が少なく、より明確であったため、Googleが以前のテストからOpenAIとの差を大きく縮めたことが示唆されています。
(出典:Ars Technica)