Google推出升级版 Gemini 2.5 Pro 预览版

Cnbeta 前天 00:47

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

谷歌推出了Gemini 2.5 Pro的“升级预览版”，该版本基于上个月发布的2.5 Pro I/O版本，重点提升了编程能力。新模型在多个基准测试中表现出色，包括AIDER Polyglot以及评估数学、科学、知识和推理能力的GPQA和Humanity's Last Exam (HLE)。同时，Gemini 2.5 Pro在LMArena和WebDevArena上的Elo分数均有显著提升。谷歌还改进了模型的“样式和结构”，以提升其创造力和响应格式。目前，该更新已通过Google AI Studio和Vertex AI推送至Gemini API，开发者可控制成本和延迟，Gemini应用也将获得升级。

🚀 Gemini 2.5 Pro的“升级预览版”基于上个月发布的2.5 Pro I/O版本，重点在于提升模型能力。

💻 在编程能力方面，新模型在AIDER Polyglot等基准测试中保持领先优势。

🧠 在评估数学、科学、知识和推理能力的GPQA和Humanity's Last Exam (HLE)等高难度基准测试中，Gemini 2.5 Pro也取得了顶级表现。

📈 Gemini 2.5 Pro在LMArena和WebDevArena上的Elo分数分别跃升24分和35分，性能显著提升。

🎨 谷歌改进了模型的“样式和结构”，旨在提升Gemini 2.5 Pro的创造力和响应格式。

🛠️ 该更新已通过Google AI Studio和Vertex AI推送至Gemini API，开发者可以控制成本和延迟，Gemini应用也将获得2.5 Pro预览版升级。

Google今天发布了 Gemini 2.5 Pro 的“升级预览版”，并将在未来几周内全面上市。此版本模型更新基于上个月发布的 2.5 Pro I/O 版本 (05-06)，带来了编程能力升级。如今，06-05 在 AIDER Polyglot 等基准测试中继续保持了这种领先优势，同时在“GPQA 和 Humanity's Last Exam (HLE)”——这些极具挑战性的基准测试中，评估模型的数学、科学、知识和推理能力——也取得了顶级表现。

与此同时，Google指出，今天 06-05 在“LMArena 上的 Elo 分数跃升 24 分”，达到 1470 分，而在“WebDevArena 上的 Elo 分数跃升 35 分，达到 1443 分”。

在最近几次模型升级中，一些人注意到编程之外的性能有所下降，尤其是与03-25相比。Google现在正在通过改进“样式和结构”来解决这一反馈，以便 Gemini 2.5 Pro“能够通过格式更好的响应更具创造力”。

Gemini 2.5 Pro 模型更新目前仍处于预览阶段，但您可以期待“几周后”正式发布并发布稳定版本。它现已通过 Google AI Studio 和 Vertex AI 推送至 Gemini API，开发者能够根据预算控制成本和延迟（正如2.5 Flash 中引入的那样）。Gemini 应用今天也将获得 2.5 Pro 预览版升级。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签