智源社区 05月08日 13:00
谷歌上线 Gemini 2.5 Pro 新版本,编码能力超 Claude 3.7 Sonnet
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌提前发布了Gemini 2.5 Pro Preview (I/O版),该版本在编码和多模态推理方面能力大幅提升,尤其在LMArena编程排行榜上名列第一,WebDev Arena排行榜得分也超越了Claude 3.7 Sonnet。新版本支持通过手绘草图构建网页应用,实现视频转代码、复刻风格等功能,并增加了听写入门应用。由于Gemini 2.5 Pro备受好评,谷歌决定提前发布。开发者可以通过Google AI Studio和Vertex AI使用更新的Gemini 2.5 Pro。

🥇 编码能力突破:Gemini 2.5 Pro Preview在LMArena编程排行榜上排名第一,WebDev Arena排行榜得分超越Claude 3.7 Sonnet。

🎨 多模态推理加持:通过手绘草图即可构建网页应用,实现“绘图变音频”功能,以及游戏、对象模拟等功能。

💻 实际应用场景丰富:支持视频转代码,从YouTube视频创建交互式学习应用;复刻风格,例如添加Windows 95风格的视频播放器。

🚀 新功能与开发者支持:增加了听写入门应用,开发者可以通过Google AI Studio和Vertex AI在 Gemini API 中使用更新的 Gemini 2.5 Pro。

📅 提前发布:由于Gemini 2.5 Pro备受好评,谷歌决定提前发布该版本,原计划在I/O大会上发布。

文章转载自「量子位」

今日,谷歌提前推出了Gemini 2.5 Pro的最新版:Gemini 2.5 Pro Preview (I/O 版),该版本在编码和多模态推理方面的能力大幅提升。

其中,Gemini 2.5 Pro Preview 在LMArena编程排行榜上名列第一,同时在 WebDev Arena 排行榜上的得分超过了Claude 3.7 Sonnet (20250219)。

目前,Gemini 2.5 Pro Preview 05-06已经在Google AI Studio上线,用户可以体验并使用。开发者可以通过Google AI Studio和Vertex AI在 Gemini API 中使用更新的 Gemini 2.5 Pro 开始构建。


Founder Park 正在搭建「AI 产品市集」社群,邀请从业者、开发人员和创业者,扫码加群: 

进群后,你有机会得到:

    最新、最值得关注的 AI 新品资讯; 

    不定期赠送热门新品的邀请码、会员码;

    最精准的AI产品曝光渠道

如果你想提交自己的产品,点击文末的「阅读原文」即可。


01 

首个横扫文本、视觉和 WebDev 的单一模型

因为大家太过热情, Gemini 2.5提前重磅更新——

史上最强编码模型Gemini 2.5 Pro Preview的I/O版。

只需一张手绘的草图,就可以构建一个「绘图变音频」的网页版应用。

其他游戏、对象模拟等等也都可以通过一句提示完全搞定。

它在所有LMArena排行榜上均超越Claude位列第一,包括所有文本领域、视觉以及WebDev Arena排行榜。

为此,这也是有史以来单一模型首次横扫文本、视觉和WebDev领域!

网友们表示,好家伙,不用买Cursor了。


02 

代码能力屠榜

此次更新的重点就在于编码能力,包括不限于改进前端和UI开发,以及基础编码任务(例如代码转换和编辑,以及创建复杂的代理工作流)。

以前端web开发来说,它目前在WebDev Arena排行榜上位列第一。这个排行榜专门用来衡量人类对模型构建美观且功能强大的Web应用能力的偏好。

与之前版本相比,相当于上涨了147分。Demis Hassabis表示:no big deal。(doge)

目前像Cursor背后公司、Cognition和Replit等都使用了该模型。

具体来看看各种实际场景中的应用。

视频转代码

基于模型的视频理解能力,它可以从单个 YouTube 视频创建交互式学习应用。

就像这样~跟之前模型版本相比,用户界面也更加完善。

它在VideoMME 上获得了84.8% 的得分。

新功能开发

实现新功能意味着需要手动深入设计文件,检查组件以匹配颜色、字体、内边距、外边距和边框等样式属性,然后手动编写所需的 CSS 代码来准确复制这些视觉属性。

但现在只需一句提示词,就可以复刻风格,比如添加一个windows 95风格的视频播放器。

除此之外,它还增加了一些新功能,比如听写入门应用,只需说出你的想法,Gemini就能将创意变为现实。

目前,开发者可以通过Google AI Studio和Vertex AI在 Gemini API 中使用更新的 Gemini 2.5 Pro 开始构建。Gemini App的用户也可以使用它。

03

因为太受欢迎,

决定提前发新版本

在官方博客中,他们还表示:这个版本原计划在几周后的Google I/O大会上发布,但由于Gemini 2.5太受欢迎,于是决定现在发。

这是基于 Gemini 2.5 Pro编码和多模态推理功能所获得的广泛好评而做出的改进。

有一说一,Gemini 2.5这一系列确实受到不少关注。

就在前几天,Gemini 2.5 Pro在直播中通关了《宝可梦蓝》,成为首个大模型宝可梦联盟冠军,直接打破了此前Claude的记录。

此次新版本一出,有网友给出了高度评价:Gemini取代Gemini是一个信号,表明有些事情已经发生了变化。

谷歌在各个方面都在稳步发展。头把交椅仍会易主,但巨龙已经苏醒了。

那么,问题来了,既然模型新版本这么强大,为啥谷歌不更新版本号呢?(手动狗头)


更多阅读

中国 AI 投资人:练习时长两年半

OpenAI大动静:放弃盈利性转型,30亿美元收购Windsurf

Meta推出独立AI应用,指向AI社交方向
沉浸式翻译团队新品:BabelDOC PDF,无损翻译 PDF,免费用户可用
Qwen 3 发布,开源正成为中国大模型公司破局的「最优解」

转载原创文章请添加微信:founderparker

内容中包含的图片若涉及版权问题,请及时与我们联系删除

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini 2.5 Pro 谷歌 AI模型 编码能力 多模态
相关文章