掘金 人工智能 07月23日 11:06
谷歌 DeepMind Gemini新模型拿下IMO国际数学奥赛【金牌】,谷歌有王者风度,OpenAI 丢人丢到全世界
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌DeepMind的Gemini模型在国际数学奥林匹克(IMO)上取得了历史性突破,其升级版本Deep Think成功斩获金牌。该模型在6道题目中答对5道,总分35分,仅用4.5小时便完成答题,较去年进步显著。DeepMind此次的胜利不仅是技术实力的体现,更因其严格遵守赛事规则、尊重人类选手的态度赢得了业界的广泛赞誉,与OpenAI的“抢跑”行为形成鲜明对比,引发了关于AI竞赛中“品格”与“风度”的讨论。

🏆 Gemini AI的重大突破:谷歌DeepMind开发的Gemini模型(升级版Deep Think)在国际数学奥林匹克(IMO)竞赛中表现卓越,以35分的成绩(满分42分)荣获金牌。该模型在4.5小时内完成了6道题中的5道,其解决方案被IMO主席认证为清晰、精准且易于理解,标志着AI在复杂数学推理能力上的重要里程碑。

🚀 技术升级与方法创新:与去年需要三天时间并借助AlphaProof和AlphaGeometry两个模型合作相比,今年的Gemini模型仅用4.5小时便夺得金牌,进步巨大。其采用的“增强推理模式”能够并行思考多种解题思路并进行结合,并通过高质量数据训练、海量题库学习以及通用解题技巧的融入,显著提升了解决数学难题的能力,全程使用自然语言端到端作答,无需预处理题目格式。

🤝 赢得尊重与赞誉:DeepMind的成功不仅在于技术成就,更在于其严守IMO官方规则,以受邀者身份参赛,并与人类选手享受同等待遇。这种透明、得体的发布方式赢得了包括马斯克在内的科技界广泛祝贺和Meta AI科学家的称赞,展现了AI发展中对规则的尊重和对竞争对手的体面。

⚖️ 对比与反思:与DeepMind的稳健表现形成对比的是OpenAI在IMO竞赛中的“抢跑”行为,其在官方宣布前抢先发布消息,引发了对赛事组织者“不礼貌”的批评。这不仅凸显了在AI军备竞赛中吸引关注的重要性,也引发了关于如何在技术竞争中保持“品格”和“格局”的深刻思考,强调了赢得体面与赢得突破同样重要。

💡 未来应用与领导者:DeepMind的“深度思考”模型未来将首先开放给小部分专家试用,随后将提供给每月1400元的Google AI Ultra付费订阅用户。该项目由谷歌DeepMind高级研究员Thang Luong领导,他曾是深度学习在机器翻译领域的开创者之一,也是谷歌早期聊天机器人Meena、LaMDA、Bard及Gemini系列模型的关键开发者,同时也是AlphaGeometry项目的负责人。

零、前言

一、Gemini的一个进阶版本 Deep Think:斩获金牌

谷歌的Gemini模型这次在国际数学奥林匹克(IMO)上拿下了官方认证的金牌。

经过官方评审打分,它在6道题中做对了5道,总共拿到了35分,这个成绩获得金牌。

拿下金牌的,是Gemini的一个升级版本,用上了全新的推理方式。

未来这个版本会开放给Google AI Ultra订阅用户——就是每月收费1400元的那种高级用户服务。

去年DeepMind花了三天时间才拿到银牌,今年只用了4.5小时就夺金,进步可以说是非常惊人。

除了DeepMind CEO哈萨比斯、谷歌CEO劈柴哥给团队发来贺电,连马斯克也在社交平台上发文表示祝贺。这波DeepMind的表现,堪称风光无限,几乎得到了各界的集体祝贺,不仅成绩好,发布也做得体面。

相比之下,OpenAI就有些尴尬了——同样参加IMO比赛,不仅搞得很神秘,还为了宣传效果硬要和人类中学生抢风头。

现在奥特曼领导下的OpenAI,最近的表现简直是一波接一波的“社死”场面。

DeepMind公告显示,Gemini新模型做对了今年IMO六道题中的五道,获得了35分。

并且这一成绩,也获得了IMO主席Gregor Dolinar的亲自认证:

我们可以确认,谷歌DeepMind已达到人们梦寐以求的里程碑,获得了35分(满分42分)——堪称金牌。

他们的解决方案在很多方面都令人惊叹。IMO评分员认为这些解决方案清晰、精准,而且大多数都易于理解。

整个评分过程严格按照IMO的标准,时间也和人类选手一样,都是在4.5小时内完成答题并交卷。

而去年DeepMind还需要AlphaProof和AlphaGeometry两个模型一起合作,花了三天时间才拿到银牌。

这次不仅速度快了很多,而且全程用自然语言端到端完成,不需要像去年那样先修改题目格式才能作答。

二、DeepMind宣布成绩,被硅谷夹道欢迎

DeepMind 的人工智能模型受到了整个科技圈的一致好评,就连竞争对手也纷纷点赞。

比如马斯克简单地表示了祝贺,而 Meta 公司的人工智能科学家也称赞 Gemini 模型给出的解题方法十分清晰准确,非常适合用来学习。大家之所以如此欢迎它,不仅是因为它的技术表现出色,还因为谷歌在整个过程中非常遵守国际数学奥林匹克(IMO)的规则。

他们是受到官方邀请参赛的,比赛标准和人类选手完全一样,而且也听从官方的要求,没有为了抢热度而提前公布结果。DeepMind 的负责人哈萨比斯虽然在社交媒体上没有直接点名 OpenAI,但字里行间似乎都在暗暗地和对方较劲。

他发文主要强调了三点:我们的官方消息没有抢跑,我们的成绩是经过 IMO 官方认证的,而且我们的模型未来是真实可用的。

三、Deep Think的技术细节

Gemini 之所以能解决这么复杂的数学题,是因为它用了一种叫做 “增强推理模式” 。这个模式很特别,它能像人一样同时想出好几种解题思路,然后把它们结合起来,而不是一条道走到黑。

为了让这个模式更强大,研究团队还专门做了几件事:用最新的技术训练它,让它学习海量的解题步骤和证明过程;给它喂了很多高质量的数学题库;还在程序里加入了一些解题的通用技巧。

最重要的是,DeepMind 的成绩是经过国际数学奥林匹克(IMO)官方认证的,评分标准和真人学生完全一样。

四、Deep Think即将开放

谷歌 DeepMind 计划先让一小部分信得过的专家(比如数学家)来试用这个“深度思考”模型,之后再开放给谷歌 AI Ultra 的付费订阅用户。这个订阅服务的价格大约是每月1400元人民币。

五、Google DeepMind高级主任研究员- Thang Luong

这个项目是由一位名叫 Thang Luong 的技术大牛领导的。他现在是谷歌 DeepMind 的高级研究员。

这位大神在斯坦福读博士的时候,就是把深度学习用到机器翻译领域的开创者之一。

在谷歌工作期间,他开发了多个顶尖的人工智能模型,并且在2020年推出了当时世界上最强的聊天机器人 Meena,这个项目后来演变成了谷歌的 LaMDA、Bard 以及现在的 Gemini 系列。

他还是著名算法“Luong Attention”的发明者,并且从2022年开始,负责领导能解决奥数级别几何题的 AlphaGeometry 项目。

六、OpenAI「截胡」

有知情人士说,其实 DeepMind 在周五下午就已经确认获得了 IMO 金牌,但为了稳妥,打算等内部流程走完,到周一再正式宣布。

没想到,OpenAI 在周六凌晨就迫不及待地公布了他们的成绩,一下子把所有人的目光都吸引过去了。

据说,IMO 官方本来希望这些 AI 公司能等闭幕式一周后再公布消息,免得抢了获奖学生们的风头。但 OpenAI 因为没有和官方合作测试,所以可能并不知道这个“君子协定”。

后来,OpenAI 的人出来解释说,他们是在闭幕式结束后才发布的,也提前通知了赛事组织者。

但是 IMO 的协调员却说,OpenAI 在闭幕晚会前就发了消息,这种行为非常“不礼貌,也不合适”。

不过,对于 OpenAI 和它的老板 Sam Altman 来说,他们非常清楚,在如今这场人工智能的竞赛中,谁能吸引到最多的关注,谁才是赢家。

七、感受

谷歌DeepMind的这场胜利,不仅仅是技术上的里程碑,更是一场关乎“品格”的完美展示。

当大家为Gemini的惊人进步欢呼时,更令人称道的是DeepMind对规则的遵守和对人类选手的尊重。这与OpenAI急于求成的“抢跑”行为形成了鲜明对比,也让我们看到,在激烈的人工智能竞赛中,如何赢得漂亮、赢得体面,或许比单纯的技术突破更重要。真正的王者,不仅要有超凡的实力,更应有令人信服的风度与格局。

好用的功能太多太多,我就不在这个一一列举了,有兴趣的可以自行尝试。

可体验O3,o4-mini 支持deep research深入研究,gpt4.1系列,deepseek R1,kimi k2大模型,grok3大模型,grok4大模型,gemini2.5pro/gemini2.5pro plus大模型,claude 4大模型

体验网址:sass.xiaoxuzhu.cn/

有提供免费的授权码可体验~

有提供免费的授权码可体验~

有提供免费的授权码可体验~

私信虚竹哥,获取体验码~国内可直接使用~

我是虚竹哥,目标是带十万人玩转AI。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini DeepMind 国际数学奥林匹克 AI 数学竞赛
相关文章