OpenAI被曝IMO金牌「造假」，陶哲轩怒揭内幕！

智源社区 07月22日 12:47

OpenAI被曝IMO金牌「造假」，陶哲轩怒揭内幕！

近日，OpenAI声称在国际数学奥林匹克（IMO）竞赛中夺得金牌，引发了广泛关注和争议。据报道，OpenAI可能违反了IMO关于结果公布时间的规定，在闭幕式尚未结束前便发布了测试结果，此举被指责“失礼且不妥当”，并有违“慢科研”的学术惯例。尽管OpenAI研究科学家对此进行了回应，但其结果的官方有效性仍受到质疑，谷歌DeepMind等机构也对此事持保留态度。有专家指出，尽管大型语言模型在解决已知问题上能力强大，但面对IMO第六题这类需要高度创造性思维的难题时，其表现仍有待提升，短期内难以取代人类数学家的创造性研究。

🧐 **OpenAI IMO金牌声明的争议性**: OpenAI宣布在IMO竞赛中获得金牌，但其结果公布时间早于IMO规定的闭幕式结束后一周，这被认为是违反了竞赛规则，引发了关于其声明有效性的质疑。IMO组委会成员和协调员普遍认为OpenAI此举“失礼且不妥当”，并且OpenAI并非IMO合作测试的AI公司之一，其结果未得到IMO官方认证。

🤔 **学术规范与公关策略的冲突**: 谷歌DeepMind等研究机构的“慢科研”学术作风与OpenAI的提前发布行为形成鲜明对比。OpenAI的行为被部分人士视为抢夺人类学生风头，并可能存在过度炒作的成分。即使OpenAI研究科学家声称是按照要求在闭幕式结束后发布，但其发布的时机和方式仍引发了外界的普遍不满，认为这缺乏对参赛学生和学术研究的尊重。

💡 **AI在数学研究中的潜力和局限**: UCLA应用数学教授Ernest Ryu指出，尽管大型语言模型（LLM）在解决标准数学问题上表现出色，并能显著加速研究过程中已知部分的实现，但它们在面对需要高度创造性思维和解决未知问题（如IMO P6题）时，仍存在明显局限。他认为，短期内AI不会取代数学家，因为数学研究的核心在于解决“没有人知道如何解决”的问题，这需要人类独有的创造力。然而，未来十年，LLM将成为数学家重要的辅助工具，提升研究效率。

编辑：桃子好困

OpenAI夺下IMO金牌，最新大瓜又来了。

昨日，因内部审核流程，谷歌DeepMind研究员在评论区，暗讽OpenAI抢先发布测试结果。

原来，事情并非那么简单。

一位IMO内部人士透露，实际上OpenAI并没有和组委会合作，拿下AI金牌不一定真实有效。

最关键的是，他们违背了IMO规定的「公布时间」规则。

为了避免AI公司们抢夺人类学生的风头，IMO评审团要求：在闭幕式结束一周后再公布结果。

然而，OpenAI却在闭幕Party还未结束前，就发布了结果。

对此，谷歌DeepMind负责人Thang Luong表态，「是的，IMO组委会有一份不对外公开的官方评分标准」。

若未依据该标准进行评估，任何奖牌声明均无效。

扣除1分后应为银牌，而非金牌。

这么说来，OpenAI声称拿下IMO金牌，只是自嗨？！

OpenAI真面目被戳穿

抢夺学生风头

就在昨天，菲尔兹奖得主陶哲轩在一口气连发三条评论，暗指的就是OpenAI。

他表示，「自己不会评论任何未预先公开测试方法的AI竞赛成绩报告。在缺乏受控测试环境的情况下，AI的数学能力难以准确评估」。

另外，IMO组委会一位成员Joseph Myers透露，OpenAI并非是IMO合作测试模型的AI公司之一。

而且，阳光海岸的91位协调员（Coordinator）也无人参与结果评估。

P6题协调员表示，「IMO评审团和协调员一致认为，OpenAI此举显得失礼且不妥当」。

根据IMO规定，借助AI模型参赛的公司，需要在7月28日之后公布结果。

一家专注于数学AI初创公司Harmonic官方发文，从侧面印证了这一规定存在的准确性。

最新回应引热议

OpenAI研究科学家，德扑之父Noam Brown下场回应，给出了两点证明：

首先，团队是在闭幕式「之后」公开结果。闭幕式有直播记录，这一点很容易核实。

其次，他确认了OpenAI并未与IMO进行协调，只是在发帖前与一位组织者告知了此事。出于对参赛学生的尊重，要求OpenAI等到闭幕式结束后再发布——「我们也照做了」。

对此，有人还精细计算了闭幕式和公开结果的时间差。

IMO闭幕式的时间在7月19日（当地时间）下午4点举行闭幕式，直播时间1小时43分钟，结束时间不晚于5点43分。

再来看负责人Alexander Wei的发文时间，7月19日下午3:50（东八区），也就是当地时间的5点50分。

从时间来看，确实是OpenAI在IMO闭幕式结束7分钟后，才发布了公告。

即便如此，网友们仍旧看不惯OpenAI炒作风暴，而且根本没有给获奖学生留有余地。

而且，可以确定的是，OpenAI公布的结果，并没有得到IMO官方认证。

未来几天，谷歌DeepMind会正式发布AI夺下IMO 2025细节。

马库斯愤怒抨击，太符合品牌调性了。

UCLA数学教授

LLM短期内不会取代人类

针对LLM拿下IMO金牌事件，来自UCLA应用数学教授Ernest Ryu发表了自己的看法。

1. OpenAI IMO P1-P5的解答目测是正确的。

2. 第6题是一个明显新颖且难度更高的问题。可以说第1-5题仍在「标准」IMO解题技巧范围内，但第6题需要创造性思维。

他表示，根据自己使用LLM进行数学研究的经验，Gemini的表现优于ChatGPT。

但OpenAI抢先在周六宣布了结果，而谷歌DeepMind「慢科研」学术作风，让他们输掉了这场公关战。

不过，Ernest Ryu认为，在短期内，大模型不会取代数学家。

因为数学研究是，解决那些目前「没有人」知道如何解决的问题（训练数据分布之外），即类似IMO P6题。这需要极大的创造力，OpenAI的模型在IMO解题中恰恰缺乏这种能力。

然而，对于那些人类已有能力解决的问题（训练数据分布之内），LLM只会变得愈加强大。

在数学研究中，人们会将现有技术与新创意相结合，LLM将显著加速前一部分工作的实现。

Ernest Ryu还预测，在接下来十年里，越来越多的数学家将借助LLM来搜索证明框架中的已知部分，从而提升研究效率。

老一辈数学家或许会对此唏嘘不已，但年轻一代只会继续产出优秀成果。

参考资料：

https://x.com/ns123abc/status/1947016206768046452 https://x.com/lmthang/status/1946960256439058844 https://x.com/Mihonarium/status/1947027989608190065

内容中包含的图片若涉及版权问题，请及时与我们联系删除

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI IMO 人工智能 AI竞赛数学研究

相关文章

人工智能正在摧毁互联网内容生态系统

阿里云：通义千问API日调用量破亿企业用户破9万

【iThome 2024 CIO大調查系列1】AI、資安和永續變革三箭齊發

鈺登跨入AI，推出搭配英特爾四代Xeon SP與Gaudi2的伺服器

OpenAI加入C2PA指導委員會，測試Deepfake圖像偵測工具

蘋果發表M4晶片，更新iPad產品線

Red Hat推出AI平臺，內建IBM開源Granite模型