Google 新的 Gemini Pro 模型再次创下基准测试记录

TechCrunch
Google 发布了 Gemini 3.1 Pro,该模型创下了基准测试记录,超越了其前身 Gemini 3。

内容摘要

Google 最近发布了其强大的大型语言模型(LLM)的最新版本 Gemini 3.1 Pro,目前可作为预览版使用。该新模型比其前身 Gemini 3 有了显著的提升。包括“人类的最后一次考试”在内的独立基准测试显示,Gemini 3.1 Pro 的性能明显优于早期版本。此外,AI 初创公司 Mercor 的首席执行官 Brendan Foody 证实,Gemini 3.1 Pro 登上了 APEX-Agents 排行榜榜首,该系统用于衡量模型在真实专业任务上的表现,这表明 AI 代理在知识工作方面的改进速度很快。此次发布正值科技巨头(如 OpenAI 和 Anthropic)在开发更强大的代理工作和多步推理 LLM 方面的竞争日益激烈之际。

(来源:TechCrunch)