Gemini 是否已超越 ChatGPT?我们将 AI 模型付诸测试。
内容摘要
Ars Technica 对 Google Gemini (3.2 Fast) 和 OpenAI ChatGPT (5.2) 的默认非订阅模型进行了比较测试,此举是受到苹果决定将 Gemini 集成到 Siri 的影响。评估涵盖了笑话、数学问题、创意写作、传记生成、撰写困难邮件、医疗建议、电子游戏指导和紧急降落飞机等复杂提示。Gemini 在四个提示中获胜(数学、邮件、传记、游戏指导),而 ChatGPT 赢了三个(笑话、创意写作、降落飞机),医疗建议被判为平局。尽管 Gemini 获得了更多分数,但在紧急降落场景中,ChatGPT 因优先考虑安全而非直接指导而被认为更实用。然而,Gemini 在信息任务中总体上表现出更少的的事实错误和更好的清晰度,表明谷歌自上次测试以来已大大缩小了与 OpenAI 的差距。
(来源:Ars Technica)