谷歌推出了Gemini 2.5 Pro的“升级预览版”,该版本基于上个月发布的2.5 Pro I/O版本,重点提升了编程能力。新模型在多个基准测试中表现出色,包括AIDER Polyglot以及评估数学、科学、知识和推理能力的GPQA和Humanity's Last Exam (HLE)。同时,Gemini 2.5 Pro在LMArena和WebDevArena上的Elo分数均有显著提升。谷歌还改进了模型的“样式和结构”,以提升其创造力和响应格式。目前,该更新已通过Google AI Studio和Vertex AI推送至Gemini API,开发者可控制成本和延迟,Gemini应用也将获得升级。
🚀 Gemini 2.5 Pro的“升级预览版”基于上个月发布的2.5 Pro I/O版本,重点在于提升模型能力。
💻 在编程能力方面,新模型在AIDER Polyglot等基准测试中保持领先优势。
🧠 在评估数学、科学、知识和推理能力的GPQA和Humanity's Last Exam (HLE)等高难度基准测试中,Gemini 2.5 Pro也取得了顶级表现。
Gemini 2.5 Pro 模型更新目前仍处于预览阶段,但您可以期待“几周后”正式发布并发布稳定版本。它现已通过 Google AI Studio 和 Vertex AI 推送至 Gemini API,开发者能够根据预算控制成本和延迟(正如2.5 Flash 中引入的那样)。Gemini 应用今天也将获得 2.5 Pro 预览版升级。