多项力压 Grok 4、OpenAI o3，谷歌推出 Gemini 2.5 Deep Think 模型

IT之家 19小时前

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

谷歌正式发布了 Gemini 2.5 Deep Think 模型，现已向 Google AI Ultra 订阅用户开放。该模型在多项关键基准测试中表现出色，超越了 OpenAI 的 o3 和 xAI 的 Grok 4。Gemini 2.5 Deep Think 采用全新研究方法，可在作答前综合多个假设进行推理，并结合了早期内测用户的反馈和最新研究成果进行优化，性能较初版有显著提升。虽然其在 2025 年 IMO 基准测试中仅达到铜牌水平，但该模型在 LiveCodeBench V6、Humanity’s Last Exam、IMO 2025 和 AIME 2025 等项目上均展现出优异性能。Google AI Ultra 用户可在 Gemini 应用中限定次数使用此功能，未来还将通过 Gemini API 向开发者提供。

✨ Gemini 2.5 Deep Think 模型正式上线，为 Google AI Ultra 订阅用户提供，并在多项关键基准测试中超越竞争对手，包括 OpenAI 的 o3 和 xAI 的 Grok 4。

🧠 该模型采用了创新的“Deep Think”模式，能够在生成答案前综合多个假设进行推理，这是其核心优势之一，并且在发布前结合了用户反馈和最新研究进行了优化，显著提升了性能。

🏆 尽管在 2025 年 IMO 基准测试中表现为铜牌水平，但 Gemini 2.5 Deep Think 在 LiveCodeBench V6、Humanity’s Last Exam、IMO 2025 和 AIME 2025 等多个项目上的优异表现，证明了其在复杂推理和代码理解方面的强大能力。

💡 Google AI Ultra 用户可以在 Gemini 应用中每日限定次数使用 Deep Think 功能，用户可以通过输入栏的“Deep Think”选项启用，该功能将自动集成代码执行和谷歌搜索等工具，未来还将通过 API 向开发者开放。

IT之家 8 月 1 日消息，谷歌今晚宣布，Gemini 2.5 Deep Think 模型现已正式上线，现已在 Gemini 应用中向 Google AI Ultra 订阅用户开放。这款新模型在多个关键基准测试中超越了 OpenAI 的 o3 和 xAI 的 Grok 4。

据外媒 Neowin 报道，今年 5 月，谷歌在 Google I/O 大会上首次介绍了 Gemini 2.5 Pro 的 Deep Think 模式，采用全新研究方法，可在作答前综合多个假设进行推理。本次发布的是该功能的升级版，结合早期内测用户的反馈和最新研究成果进行了优化。谷歌表示，新版本在性能上相比最初的 I/O 版本有了显著提升。

谷歌还透露，这一模型是此前模型的一个变体（IT之家注：前述模型已在国际数学奥林匹克竞赛中获得金牌）。为适应日常使用场景，谷歌对其进行了加速优化，因此在 2025 年 IMO 基准测试中仅达到铜牌水平。

从基准测试结果可知，Gemini 2.5 Deep Think 在 LiveCodeBench V6、Humanity’s Last Exam、IMO 2025 和 AIME 2025 等项目中均表现优异。

目前，Google AI Ultra 用户每天可以在 Gemini 应用中以限定次数使用 Deep Think。当启用 Gemini 2.5 Pro 模型时，输入栏会显示“Deep Think”选项。谷歌指出，该功能将自动集成代码执行和谷歌搜索等工具。谷歌还计划在未来几周内，通过 Gemini API 向部分开发者提供带工具与不带工具的 Deep Think 模型版本。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签