机器之心 14小时前
中国队重夺IMO奥数冠军,6金双满分碾压全场,AI连铜牌都拿不到
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

中国队在第66届国际数学奥林匹克竞赛(IMO)中表现卓越,以六枚金牌和双满分的佳绩重夺冠军宝座。中国队总分高达231分,在前五道题目中均获得满分,并在第六题中取得了全场最高的21分。本次赛事共有100多个国家和地区的数学顶尖少年参与,中国队自1985年参赛以来,已有多位选手连续两届入选国家队,包括曾获满分的韦东奕。去年的冠军美国队此次位列第二,韩国队和日本队分列第三、四名。AI大模型在本次竞赛中表现不佳,Gemini 2.5 Pro得分31%,Grok 4则表现一般,显示出AI在最高水平智力竞赛方面仍有提升空间。

🥇 中国队在第66届国际数学奥林匹克竞赛(IMO)中以六金双满分的优异成绩再次夺冠,总分231分,前五题均获满分,第六题得分21分,展现了中国数学教育的实力。

🌟 本届IMO汇聚了来自五大洲100多个国家和地区的数学精英,中国队选手邓哲文和徐祺铭已是连续两届入选国家队,这延续了中国队自1985年参赛以来的优秀传统,也包括了北京大学助理教授韦东奕等历史上的杰出选手。

🏆 国际数学奥林匹克竞赛(IMO)是面向高中生的全球性数学赛事,被誉为数学界的“世界杯”。本届赛事在澳大利亚昆士兰州举行,中国队已连续五年(2019-2023年)获得IMO冠军,此次胜利进一步巩固了其领先地位。

💡 IMO竞赛题目共六道,分为两天进行,每题满分7分,总分42分,涵盖代数、几何、数论、组合等领域。今年的考题难度分布不均,前五题相对容易,导致金牌数量增加,而第六题难度极高,全球仅6人破解。

🤖 在AI能力评估方面,包括Gemini 2.5 Pro和Grok 4在内的大模型在IMO 2025的真题测试中表现不佳,未能获得任何奖牌,尽管Gemini 2.5 Pro有所改进,但AI在人类最高水平智力竞赛中的表现仍有较大提升空间。

机器之心报道

编辑:泽南、杨文

祝贺中国队!


本周六早上传来消息,在国际数学奥林匹克竞赛 IMO(International Mathematical Olympiad)比赛上中国队重夺冠军,获得了六金、双满分的佳绩。



从「成绩单」来看,中国队总分 231 分,在前五道题目中获得全满分,第六题拿下团队 21 分也为全场最高分。


本届中国代表队名单:


    邓哲文(高二) 湖北省武昌实验中学

    徐祺铭(高二) 武汉市经开外国语高级中学

    谈弘毅(高二) 武汉市经开外国语高级中学

    张恒烨(高二) 重庆市巴蜀中学校

    董镇宇(高三) 杭州学军中学

    邓乐言(高一) 上海市上海中学



其中邓哲文和徐祺铭已连续两届入选国家队。自 1985 年中国队首次参加 IMO 以来,已有 17 位选手连续两届入选国家队,包括北京大学助理教授韦东奕,他曾在 2008、2009 年两次获得满分。


自 2019 年到 2023 年,中国队曾连续获得 IMO 冠军。


去年的冠军美国队本次获得了五金一银的成绩,位居第二。



第三名韩国队四金二银,第四名日本队三金二银一铜,其中加野聪一人获得满分金牌。


另外本届加拿大派出了纯华人的阵容,获得两金两银一铜位居第十二位,Warren Bei 获得了满分金牌。



国际数学奥林匹克竞赛(InternationaMathematical Olympiad,简称 IMO)是一项面向高中生的全球性数学竞赛,被誉为数学界的世界杯。


在 1959 年,该项赛事首次在罗马尼亚举办,目前 IMO 已经发展成为一个年度国际赛事,每年来自五大洲 100 多个国家和地区的数学顶尖少年竞相角逐。


今年的 IMO 是第 66 届,在澳大利亚昆士兰州阳光海岸举行,比赛自 7 月 15 日开始。这是继 1988 年澳大利亚堪培拉第 29 届 IMO 之后,澳大利亚第二次承办 IMO 赛事。



IMO 2025 题目


IMO 的竞赛题目通常包括六道,分为两天进行,每天的考试时间为 4.5 小时,参赛者每天需完成 3 道题目,每题 7 分,满分 42 分。试题内容涵盖代数、几何、数论、组合等多个领域,旨在测试选手的数学知识和解题能力。


金牌的分数线是 35 分,银牌 28 分,铜牌 19 分。今年的考题据说前五题对于顶级高手来说并不很难,因此共产生了 72 枚金牌,比去年多 19 个。


相比之下,第六题难度极高,全球仅 6 人破解,最后 5 人获满分。


第一题:



第二题:



第三题:



第四题:



第五题:



第六题:



大家觉得今年的题目难度如何,在评论区聊聊吧。


大模型 IMO2025 成绩:无人拿牌


最后,可能你也会关心 AI 大模型在最新真题上的成绩如何。在另一个「赛场」上,有人也已经完成了测试,没有一个大模型能拿到铜牌。


其中,Gemini 2.5 Pro 表现最佳,得分为 31%(13 分)。在之前的 USAMO 评估中,Gemini 2.5 Pro 曾因在无法提供有效证明时引用不存在的定理而受到批评, 然而在 IMO 2025 的表现中,这种行为有所减少,表明模型在此方面有所改进。


刚刚发布的 Grok 4 成绩相对一般,许多初步回答非常简短,通常只是给出最终答案而没有任何解释,类似的问题在 MathArena 的其他基准测试中也有体现,Grok-4 的回答经常缺乏深度或证明。



在 MathArena 上,研究人员聘请了 IMO 级别人类评委进行评分,评估在 2025 年 IMO 题目发布后立即开始。平均而言,AI 做题每道题答案的生成成本至少为 3 美元。


看起来,在人类最高水平智力竞赛上,AI 的能力还有待进一步提升。


参考内容:

https://www.imo-official.org/results.aspx

https://matharena.ai/imo/


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


文章原文

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

国际数学奥林匹克竞赛 IMO 中国队 AI大模型 数学竞赛
相关文章