量子位 07月22日 01:37
IMO怒斥OpenAI自封夺金,“91位评委均未参与评分”,网友:炒作无下限
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI宣布其AI模型在国际数学奥林匹克(IMO)竞赛中获得金牌,却引发了关于发布时机和结果认证的争议。IMO官方及学界人士认为OpenAI的做法“粗鲁且不恰当”,要求其延迟公布。同时,OpenAI的金牌成绩缺乏官方评估,可能无法站住脚。与此形成对比的是,谷歌DeepMind选择遵守IMO规定,低调处理。文章也聚焦了人类选手的优异表现,中国队以全员金牌的佳绩重返世界第一,多位选手表现突出,其中两位选手获得满分。此次事件也引发了关于AI与人类在数学竞赛中未来竞争的讨论。

🚨 OpenAI在IMO闭幕式前夕高调宣布其AI模型获得金牌,但IMO官方及多位学界大佬认为此举“粗鲁且不恰当”,并期望AI公司在闭幕式后至少等待一周再发布结果,以将焦点留给青少年选手。OpenAI的发布时机与IMO官方的期望存在冲突,引发了关于学术道德和商业炒作的争论。

🏅 OpenAI宣称的金牌成绩受到质疑,因为其模型并未与IMO合作进行官方测试,且91位IMO官方评委中无人参与评估其答卷。这意味着OpenAI的“金牌”成绩是自说自话,未经官方认证。另一AI团队Harmonic的公告证实了IMO要求在闭幕式后一周(7月28日后)发布结果的规定,而OpenAI在发布前仅告知了组织者,且告知信息与爆料存在出入。

⚖️ 谷歌DeepMind在此次事件中表现得更为克制,选择遵守IMO的要求,静待合适的时机公布成绩,即使其模型可能也达到了金牌水平。这与OpenAI高调张扬的做法形成鲜明对比。DeepMind的领导者补充说,IMO有官方评分指南,外部无法获取,没有基于该指南的评分就没有资格获得奖牌,进一步突显了OpenAI成绩的非官方性质。

🏆 在AI争议之外,人类选手表现尤为亮眼。中国队以全员6枚金牌、总分231分的成绩重返世界第一,力压美国队。其中,邓哲文和徐祺铭连续两年摘金,董镇宇历经三次冲击终圆梦IMO,谈弘毅也凭借优异表现入选国家队。特别值得一提的是,邓乐言和张恒烨两位选手以满分42分并列世界第一,显示了中国队在数学领域的深厚实力。

🚀 本届IMO的满分者仅有6人,且大部分选手在最后一道组合数学题上失分,而这正是OpenAI模型未能攻克的难题。文章预测,未来的数学竞赛可能演变为中国队、美国队与人工智能之间的较量。此外,下一届IMO将由上海中学承办,该校是获得IMO金牌最多的中国中学。

关注前沿科技 2025-07-21 12:23 北京

更值得关注的是青少年夺金选手

梦晨 鹭羽 发自 凹非寺量子位 | 公众号 QbitAI

OpenAI声称新模型获得IMO金牌不到24小时,剧情就出现了大反转!

多位IMO官方人士和学界大佬纷纷发声,直指OpenAI的做法“粗鲁且不恰当”

IMO主办方要求AI公司在闭幕式一周后再公布结果,让关注的焦点留在参赛的青少年上,然而OpenAI偏偏选择在闭幕式刚结束就急不可耐地宣布了成绩。

有网友评价:OpenAI一如既往的为了炒作什么都干得出来。没有官方分数,没有耐心,也没有羞耻心。

更劲爆的是,OpenAI自称的“金牌”成绩可能根本站不住脚:

OpenAI并不是与IMO合作测试模型的AI公司之一,91位IMO官方评委中没有任何人参与评估他们的答卷。这意味着,OpenAI的”金牌”成绩完全是自说自话,没有经过官方认证。

原本以为是AI发展的里程碑时刻,没想到引发了一场关于学术道德和商业炒作的激烈争论。

IMO官方怒了:”请给孩子们留点空间”

事情的导火索来自一位IMO资深人士的爆料。

Joseph Myers,这位从1992年就参与数学奥赛的元老级人物,与IMO秘书长Ria van Huffel进行了一番交谈。

IMO评审团和协调员们普遍认为,AI开发商在IMO期间(尤其是闭幕式之前)宣布成绩是”粗鲁且不恰当的”。官方期望AI公司在闭幕式后至少等待一周再发布结果。

OpenAI方面,则由参与这项研究的Noam Brown出面回应。

他的发言承认了OpenAI没有事先与IMO官方取得联系,只是在发布成绩之前告知了一位组织者,组织者要求他们在闭幕式之后再宣布成绩。

这与爆料中的要求闭幕式一周之后出现了矛盾。

那么事情到底如何呢?

另一家参加比赛的AI团队Harmonic的公告证实,确实有“闭幕式一周之后”这个要求,而且给出了具体时间期限7月28日之后。

就在OpenAI高调宣布成绩的同时,另一家AI巨头谷歌DeepMind却很克制,与OpenAI的张扬形成鲜明对比。

多位知情人士透露,DeepMind可能也取得了金牌水平的成绩,但他们选择遵守IMO的要求,静静等待合适的时机。

除了公告发布时间的问题,OpenAI到底得没得金牌也有争议。

领导DeepMind超级推理团队的Thang Luong补充,IMO内部其实有一份官方评分指南,外部无法获取。没有基于该指南的评分就没有资格获得奖牌。

这届IMO共6道题,每题7分。金牌线35分,OpenAI自报的成绩也刚刚过线,即使是解答过程中微小的扣分都可能让OpenAI从金牌跌到银牌

总之这场IMO金牌之争还远未结束,一切还是以经过IMO主办方认证的成绩为准。

One More Thing

最后让我们将聚光灯交还给人类金牌选手。

最终成绩中,中国队以全员6金牌、总分231分占据榜首,继去年以2分之差遗憾输给老对手美国队后,再度重返世界第一。

第二名则是美国队,获得了5金一银,然后依次是韩国、日本和波兰。

中国队的六位选手分别是来自武昌实验中学的邓哲文、武汉市经开外国语高级中学的徐祺铭谈弘毅、重庆巴蜀中学的张恒烨、杭州学军中学的董镇宇,以及上海中学的邓乐言

其中邓哲文徐祺铭都曾参与过2024年的IMO并成功摘金,而徐祺铭更是在去年成功入选2025年北大数学英才班。

董镇宇则是团队中唯一的高三年级,虽然他早在高一就进入国家集训队并被保送至清华姚班,但前两年的选拔中都与IMO国家队擦肩而过。

这是他第三次冲击国家队,终于百折不挠圆梦IMO。

谈弘毅在连续两年凭借中国数学奥林匹克竞赛(CMO)金牌入选国家集训队后,也同样获得了清华北大保送资格。

另外,邓乐言和张恒烨在本次IMO拿下满分42分,并列世界第一,这也是中国队从2019年起,连续7届IMO均有选手获得满分。

其中,邓乐言是中国队中年级最小的一位,只有高一的他,在去年CMO以满分成绩入选国家集训队,又在IMO国家队选拔中脱颖而出,刷新了上海近10年来IMO选手的最小年龄纪录。

去年,他还在阿里巴巴全球数学竞赛中的组合与概率赛道获得全球第五名,也是首位获得该项赛事奖牌的中学生。

张恒烨曾在2023年CMO中获得金牌并入选国家队,后来同样在阿里巴巴全球数学竞赛中获奖。去年入选国家队后,他还主动前往北大数学系旁听并受益匪浅。

要知道,本次IMO中,全球600多位参赛者,只有6人获得满分,其他所有人几乎都输在了第六题——组合数学上,这也是OpenAI唯一没有攻克的那道题。

另外,下一届IMO将在上海中学举办,上海中学至今已获得18块IMO金牌,总数位居全国第一,它也将成为全球第一所承办国际数学奥林匹克的中学。

值得注意的是,今年IMO的前30名参赛者,几乎都是亚洲或东欧面孔。

而亚军美国队也是清一色的亚洲面孔。

网友表示,也许未来的数学竞赛将是中国队vs美国队vs人工智能。

参考链接:[1]https://x.com/HarmonicMath/status/1947023450578763991[2]https://www.imo-official.org/[3]https://x.com/ai_for_success/status/1946984782178709719[4]https://x.com/lmthang/status/1946960256439058844

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

专属AI产品从业者的实名社群,只聊AI产品最落地的真问题  扫码添加小助手,发送「姓名+公司+职位」申请入群~

进群后,你将直接获得:

 👉 最新最专业的AI产品信息及分析 🔍 

 👉 不定期发放的热门产品内测码 🔥

 👉 内部专属内容与专业讨论 👂

🌟 点亮星标 🌟

科技前沿进展每日见

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI IMO 人工智能 数学竞赛 学术道德
相关文章