零、前言
一、Gemini的一个进阶版本 Deep Think:斩获金牌
谷歌的Gemini模型这次在国际数学奥林匹克(IMO)上拿下了官方认证的金牌。
经过官方评审打分,它在6道题中做对了5道,总共拿到了35分,这个成绩获得金牌。
拿下金牌的,是Gemini的一个升级版本,用上了全新的推理方式。
未来这个版本会开放给Google AI Ultra订阅用户——就是每月收费1400元的那种高级用户服务。
去年DeepMind花了三天时间才拿到银牌,今年只用了4.5小时就夺金,进步可以说是非常惊人。
除了DeepMind CEO哈萨比斯、谷歌CEO劈柴哥给团队发来贺电,连马斯克也在社交平台上发文表示祝贺。这波DeepMind的表现,堪称风光无限,几乎得到了各界的集体祝贺,不仅成绩好,发布也做得体面。
相比之下,OpenAI就有些尴尬了——同样参加IMO比赛,不仅搞得很神秘,还为了宣传效果硬要和人类中学生抢风头。
现在奥特曼领导下的OpenAI,最近的表现简直是一波接一波的“社死”场面。
DeepMind公告显示,Gemini新模型做对了今年IMO六道题中的五道,获得了35分。
并且这一成绩,也获得了IMO主席Gregor Dolinar的亲自认证:
我们可以确认,谷歌DeepMind已达到人们梦寐以求的里程碑,获得了35分(满分42分)——堪称金牌。
他们的解决方案在很多方面都令人惊叹。IMO评分员认为这些解决方案清晰、精准,而且大多数都易于理解。
整个评分过程严格按照IMO的标准,时间也和人类选手一样,都是在4.5小时内完成答题并交卷。
而去年DeepMind还需要AlphaProof和AlphaGeometry两个模型一起合作,花了三天时间才拿到银牌。
这次不仅速度快了很多,而且全程用自然语言端到端完成,不需要像去年那样先修改题目格式才能作答。
二、DeepMind宣布成绩,被硅谷夹道欢迎
DeepMind 的人工智能模型受到了整个科技圈的一致好评,就连竞争对手也纷纷点赞。
比如马斯克简单地表示了祝贺,而 Meta 公司的人工智能科学家也称赞 Gemini 模型给出的解题方法十分清晰准确,非常适合用来学习。大家之所以如此欢迎它,不仅是因为它的技术表现出色,还因为谷歌在整个过程中非常遵守国际数学奥林匹克(IMO)的规则。
他们是受到官方邀请参赛的,比赛标准和人类选手完全一样,而且也听从官方的要求,没有为了抢热度而提前公布结果。DeepMind 的负责人哈萨比斯虽然在社交媒体上没有直接点名 OpenAI,但字里行间似乎都在暗暗地和对方较劲。
他发文主要强调了三点:我们的官方消息没有抢跑,我们的成绩是经过 IMO 官方认证的,而且我们的模型未来是真实可用的。
三、Deep Think的技术细节
Gemini 之所以能解决这么复杂的数学题,是因为它用了一种叫做 “增强推理模式” 。这个模式很特别,它能像人一样同时想出好几种解题思路,然后把它们结合起来,而不是一条道走到黑。
为了让这个模式更强大,研究团队还专门做了几件事:用最新的技术训练它,让它学习海量的解题步骤和证明过程;给它喂了很多高质量的数学题库;还在程序里加入了一些解题的通用技巧。
最重要的是,DeepMind 的成绩是经过国际数学奥林匹克(IMO)官方认证的,评分标准和真人学生完全一样。
四、Deep Think即将开放
谷歌 DeepMind 计划先让一小部分信得过的专家(比如数学家)来试用这个“深度思考”模型,之后再开放给谷歌 AI Ultra 的付费订阅用户。这个订阅服务的价格大约是每月1400元人民币。
五、Google DeepMind高级主任研究员- Thang Luong
这个项目是由一位名叫 Thang Luong 的技术大牛领导的。他现在是谷歌 DeepMind 的高级研究员。
这位大神在斯坦福读博士的时候,就是把深度学习用到机器翻译领域的开创者之一。
在谷歌工作期间,他开发了多个顶尖的人工智能模型,并且在2020年推出了当时世界上最强的聊天机器人 Meena,这个项目后来演变成了谷歌的 LaMDA、Bard 以及现在的 Gemini 系列。
他还是著名算法“Luong Attention”的发明者,并且从2022年开始,负责领导能解决奥数级别几何题的 AlphaGeometry 项目。
六、OpenAI「截胡」
有知情人士说,其实 DeepMind 在周五下午就已经确认获得了 IMO 金牌,但为了稳妥,打算等内部流程走完,到周一再正式宣布。
没想到,OpenAI 在周六凌晨就迫不及待地公布了他们的成绩,一下子把所有人的目光都吸引过去了。
据说,IMO 官方本来希望这些 AI 公司能等闭幕式一周后再公布消息,免得抢了获奖学生们的风头。但 OpenAI 因为没有和官方合作测试,所以可能并不知道这个“君子协定”。
后来,OpenAI 的人出来解释说,他们是在闭幕式结束后才发布的,也提前通知了赛事组织者。
但是 IMO 的协调员却说,OpenAI 在闭幕晚会前就发了消息,这种行为非常“不礼貌,也不合适”。
不过,对于 OpenAI 和它的老板 Sam Altman 来说,他们非常清楚,在如今这场人工智能的竞赛中,谁能吸引到最多的关注,谁才是赢家。
七、感受
谷歌DeepMind的这场胜利,不仅仅是技术上的里程碑,更是一场关乎“品格”的完美展示。
当大家为Gemini的惊人进步欢呼时,更令人称道的是DeepMind对规则的遵守和对人类选手的尊重。这与OpenAI急于求成的“抢跑”行为形成了鲜明对比,也让我们看到,在激烈的人工智能竞赛中,如何赢得漂亮、赢得体面,或许比单纯的技术突破更重要。真正的王者,不仅要有超凡的实力,更应有令人信服的风度与格局。
好用的功能太多太多,我就不在这个一一列举了,有兴趣的可以自行尝试。
可体验O3,o4-mini 支持deep research深入研究,gpt4.1系列,deepseek R1,kimi k2大模型,grok3大模型,grok4大模型,gemini2.5pro/gemini2.5pro plus大模型,claude 4大模型
体验网址:sass.xiaoxuzhu.cn/
有提供免费的授权码可体验~
有提供免费的授权码可体验~
有提供免费的授权码可体验~
私信虚竹哥,获取体验码~国内可直接使用~
我是虚竹哥,目标是带十万人玩转AI。