Cnbeta 18小时前
Google推出Gemini 2.5 Deep Think模型 性能超越OpenAI o3和Grok 4
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Google在其Gemini应用程序中为Google AI Ultra订阅用户推出了Gemini 2.5 Deep Think模型。该新模型在多项关键基准测试中表现优于OpenAI的o3模型和xAI的Gork 4模型。Gemini 2.5 Deep Think模型基于早期测试人员反馈和最新研究成果进行了改进,相比首次发布时有了显著提升。该模型还结合了国际数学奥林匹克(IMO)金牌模型的变种,并为日常使用进行了速度优化。Google AI Ultra订阅用户可在Gemini应用中使用此模型,并通过提示栏的“Deep Think”选项激活。该模型能自动与代码执行和Google搜索等工具协同工作。未来几周,Gemini API也将向开发者提供该模型。

💡 Gemini 2.5 Deep Think模型在多项关键基准测试中表现出色,超越了OpenAI的o3模型和xAI的Gork 4模型,显示出其强大的AI能力。

🚀 该模型是Google I/O 2025大会上发布的Gemini 2.5 Pro深度思考模式的更新版本,集成了早期用户的反馈和最新的研究突破,性能得到了显著提升。

🏅 Gemini 2.5 Deep Think模型包含了一个国际数学奥林匹克(IMO)金牌模型的变种,尽管为了日常使用进行了速度优化,但在IMO 2025基准测试中仍达到了铜牌级别。

🛠️ Google AI Ultra订阅用户可以在Gemini应用中通过选择“Deep Think”选项来使用该模型,该模型能够自动集成代码执行和Google搜索等工具,提升了使用的便捷性和效率。

🔮 随着Gemini 2.5 Deep Think模型的推出,业界关注的焦点转向了即将到来的OpenAI GPT-5模型,其在关键基准测试中的表现将是衡量AI技术进展的重要指标。

今天,Google宣布在 Gemini 应用程序中面向 Google AI Ultra 订阅用户推出 Gemini 2.5 Deep Think 模型。该新模型在多个关键基准测试中超越了OpenAI 的 o3 模型xAI 的 Gork 4模型。

早在 5 月份的 Google I/O 2025 大会上,Google就首次发布了Gemini 2.5 Pro 深度思考模式,该模式采用了新的研究技术,能够在做出响应之前考虑多种假设。今天推出的是一个更新的深度思考模型,其中包含基于早期可靠测试人员的反馈和最新研究突破的改进。Google声称,更新后的深度思考模型比 I/O 大会上首次发布的版本有了显著改进。

Google还透露,这款新的 Deep Think 模型是最近在今年国际数学奥林匹克 (IMO) 比赛中获得金牌的模型的变种。为了使其适合日常使用,Google对其进行了速度提升,因此在 2025 年 IMO 基准测试中,其性能仅达到铜牌级别。

如上图基准测试所示,Gemini 2.5 Deep Think 在 LiveCodeBench V6、Humanity's Last Exam、IMO 2025 和 AIME 2025 中均取得了优异的表现。

Google AI Ultra 订阅用户现在可以在 Gemini 应用中使用 Deep Think,每天使用固定数量的提示,方法是使用选择 Gemini 2.5 Pro 型号时提示栏中出现的“Deep Think”选项。Google 指出,Deep Think 可自动与代码执行和 Google 搜索等工具配合使用。Google 还计划在未来几周内通过 Gemini API 向一组值得信赖的开发者发布带工具和不带工具的 Deep Think。

现在最大的问题是即将推出的OpenAI GPT-5模型是否会在关键基准测试结果中反超 Gemini 2.5 Deep Think。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini Google AI AI模型 Deep Think 人工智能
相关文章