index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html
![]()
谷歌DeepMind的先进AI模型Gemini Deep Think在2025年国际数学奥林匹克(IMO)中以35分的成绩荣获金牌,标志着AI在数学理解与推理领域取得了重大突破。该模型在4.5小时内以自然语言端到端完成了大部分题目,展现了超越传统AI的“思维数学”能力。与此前的AI系统相比,Gemini Deep Think实现了从“翻译数学”到“思维数学”的范式转变。此次成功不仅是IMO官方首次正式认证AI的参赛成绩,也引发了关于AI研发节奏与策略的讨论,DeepMind强调技术研发的严谨性与前瞻性,旨在打造能够进行严格形式证明的“超级数学助手”,服务于更广泛的科学研究领域。
🌟 Gemini Deep Think成功夺得IMO金牌,以35分的高分展示了AI在复杂数学问题解决上的卓越能力。该模型在比赛中解答了6道题中的5道,其解答的清晰度和精准度获得了IMO主席的高度评价,并实现了IMO官方首次对AI参赛结果的正式认证。
🚀 Gemini Deep Think实现了AI在数学领域的“范式转变”,从依赖形式语言翻译的“翻译数学”进步到能够以自然语言端到端完成解答的“思维数学”。它在4.5小时内完成读题、写作证明的全过程,展现了AI在理解和生成数学推理方面的飞跃。
💡 DeepMind在AI模型研发策略上展现了“节奏与分寸”。与OpenAI的快速发布不同,DeepMind选择遵循IMO的非正式约定,等待官方闭幕式后一周再公布成绩,体现了其对规则和行业生态的尊重,也避免了潜在的争议。
🧠 Gemini Deep Think的核心优势在于其“并行思维”能力,能够同时探索多个解题路径并优化组合,从而拥有更广阔的思维幅度。结合强化学习、高质量数据集以及专门的IMO解题策略,使其在解决难题时表现出色,甚至能用初等数论完成复杂问题。
📈 DeepMind正并行推进Gemini Deep Think的自然语言路线以及AlphaProof和AlphaGeometry的形式化系统,目标是构建一个既能理解人类语言又能进行严格形式证明的“超级数学助手”,为科学研究、工程设计等领域提供强大支持。
2025-07-23 12:03 中国香港
技术之上,是节奏与分寸

大数据文摘出品Gemini Deep Think正式跨入国际数学奥林匹克(IMO)金牌行列。谷歌DeepMind宣布,其搭载Deep Think模式的先进版本Gemini,在2025年IMO中斩获35分,成功达到了金牌标准。这一成绩来自对6道题中的5道完美解答,评分标准、比赛时间、参赛流程与人类选手完全一致。更关键的是,这是IMO官方首次对AI参赛结果进行正式认证,并给出与学生相同的评分机制。IMO主席Gregor Dolinar明确表示:“我们可以确认,Google DeepMind达到了这一备受期待的里程碑。解答清晰、精准,大多数都易于理解。”要知道,去年的银牌得主是DeepMind旗下的AlphaProof与AlphaGeometry组合系统,用了两到三天的时间、依赖形式语言翻译,才完成28分的成绩。今年的Gemini Deep Think,在4.5小时内用英语读题、用英语写出完整证明,全程自然语言,端到端完成任务,完成了从“翻译数学”到“思维数学”的跨越。DeepMind科学家Thang Luong称,这是AI在数学理解领域的“范式转变”。更引人注目的是,这款Gemini新模型尚未公开,但DeepMind已承诺将先开放给受信任的数学家进行测试,后续逐步向Google AI Ultra用户推出。一、技术之上,是节奏与分寸然而,在DeepMind宣布突破之前,另一场围绕“谁先发声”的风波,先点燃了整个AI圈。知情者透露,DeepMind其实在7月19日(周五)下午就完成了内部验证。但为了配合IMO官方“闭幕式后一周再公布”的非正式约定,他们决定等到下周一再正式发布。没想到,OpenAI在19日凌晨突然宣布:“我们也做到了!”结果,所有注意力一夜之间倾斜向了OpenAI,DeepMind的节奏被彻底打乱。社交平台瞬间炸开了锅。有推特网友一针见血地指出:“在这个游戏里,速度大于官僚主义。错过时机,你就失去了话语权。”而据IMO相关协调员透露,OpenAI并未与IMO官方合作测试其模型,可能“并不知道”需要等待闭幕式之后才宣布。OpenAI研究员Noam Brown随后澄清称,他们确实在闭幕式结束后才公布成绩,并事先知会了部分组织者。但据IMO内部人员披露,OpenAI其实在闭幕晚会前就公布了结果,这种行为被评价为“粗鲁和不恰当”。DeepMind CEO哈萨比斯虽然在推文中“只字未提”OpenAI,却通过强调三个点回应了全部质疑:我们没有抢跑,成绩是IMO官方认证,模型也会正式发布。这三点,恰恰击中了OpenAI的三个软肋。不仅DeepMind的节奏更体面,他们在技术层面也选择了更高成本、更针对性的AI模型研发路径。Gemini Deep Think并非通用模型,而是一个专为复杂问题设计的增强推理系统,融合了DeepMind最新的研究成果。而OpenAI的做法,则被不少网友评价为“通用模型,低资源,博营销”。二、增强推理,迈向直觉Gemini Deep Think最核心的优势,来自它独特的“并行思维”能力。在解题过程中,模型不再像传统AI那样顺着一条逻辑线推演,而是同时展开多个可能的解法路径,并在最终组合成最优方案后给出答案。这让它拥有比人类更广阔的思维幅度,又不失推理的严谨性。此外,为进一步发挥推理能力,DeepMind采用了多项技术升级:使用全新的强化学习方式训练模型;提供高质量的数学问题和解答数据集;加入专门的IMO题目解题提示与策略指令。更惊人的是,在今年的第三题中,大部分人类选手使用了研究生级别的技巧完成,而Gemini仅用初等数论,就完成了一个逻辑自洽的完整证明。至于那唯一没有解出的第六题?据说人类选手中也仅有五人解出。Gemini只是“选错了方向”。目前,DeepMind已将Gemini解答的五道题目完整公开,接受全网检验。与Gemini Deep Think同时被提及的,还有DeepMind之前的形式化系统:AlphaProof和AlphaGeometry。虽然今年Gemini完全依赖自然语言完成任务,但DeepMind明确表示,这两条路线仍会并行推进。他们的目标,是构建一个既能理解人类语言,又能进行严格形式证明的“超级数学助手”。这种AI,将不止用于数学竞赛,还能成为科学研究、工程设计、理论建模等领域的核心工具。
作者长期关注 AI 产业与学术,欢迎对这些方向感兴趣的朋友添加微信 Q1yezi,共同交流行业动态与技术趋势!
阅读原文
跳转微信打开