大模型模型取得国际奥数竞赛金牌级成绩。据英国《新科学家》杂志网站22日报道，谷歌旗下深度思维公司和美国OpenAI公司相继宣称，其AI模型在近日举行的国际数学奥...

虎嗅 07月24日 08:15

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

近日，谷歌深度思维和OpenAI宣布其AI模型在国际数学奥林匹克竞赛（IMO）中首次获得金牌级成绩，标志着AI在数学推理能力上的重大突破。去年，深度思维的AI模型已获得银牌。今年，OpenAI的AI系统在4.5小时内解答了6道题中的5道，谷歌深度思维的“双子座深度思考”系统也取得了相同的成绩。这些AI模型首次采用自然语言处理技术，并运用了强化学习等方法。尽管这一进展令人振奋，但仍有专家呼吁提供可复现的研究数据，并指出自然语言证明在验证上的潜在挑战。

🌟 AI在IMO竞赛中实现历史性突破：谷歌深度思维和OpenAI的AI模型首次在国际数学奥林匹克竞赛（IMO）中获得金牌级成绩，标志着AI在数学推理能力上达到了新的高度。此前，深度思维的模型在去年已取得银牌成绩，显示了AI在数学领域持续进步的态势。

🚀 自然语言处理与强化学习驱动AI进步：与以往专为IMO设计的模型不同，此次取得佳绩的AI模型（如OpenAI的系统和深度思维的“双子座深度思考”）均采用了自然语言处理技术，使得AI能够理解和生成自然语言的数学证明。同时，强化学习作为一种关键的学习方法，通过试错机制帮助AI实现目标，这是谷歌在AI游戏领域取得成功的关键。

🤔 成果验证与未来挑战并存：IMO主席已证实AI模型成绩的官方评定，但菲尔兹奖得主陶哲轩等专家强调了对可复现研究数据和详细技术细节的需求。此外，金牌得主约瑟夫·梅耶也指出，尽管自然语言证明更具可读性，但冗长的论证过程可能给验证带来困难，这预示着AI在数学领域的进一步发展仍需解决技术和验证上的挑战。

💡 技术细节仍待揭示：OpenAI仅透露其AI运用了强化学习与“实验性方法”，并未公布具体技术细节。谷歌深度思维则解释了“双子座深度思考”系统采用了强化学习，并提及其在“阿尔法零”等AI游戏上的成功经验。然而，对于这些AI模型如何具体实现复杂的数学推理和证明，外界仍充满好奇，技术细节的公开将有助于推动该领域的进一步研究。

大模型模型取得国际奥数竞赛金牌级成绩。

据英国《新科学家》杂志网站22日报道，谷歌旗下深度思维公司和美国OpenAI公司相继宣称，其AI模型在近日举行的国际数学奥林匹克竞赛（IMO）中，首次取得金牌级成绩。IMO一直被研究人员视为AI系统数学推理能力的试金石。去年，深度思维公司宣布，其开发的数学推理AI模型“阿尔法证明”和几何求解AI模型“阿尔法几何”携手取得银牌级成绩。19日，OpenAI宣布其新型AI系统在4.5小时内正确解答6道国际奥数竞赛题中的5道；两天后，深度思维的“双子座深度思考”系统交出了同样的成绩。

IMO主席格雷戈尔·多利纳尔证实，成绩经由竞赛官方阅卷人严格评定。与“阿尔法证明”和“阿尔法几何”系统都专为IMO打造，且使用名为“精益”的计算机编程语言编写问题和答案不同，今年两大团队的模型均采用自然语言处理技术。“双子座深度思考”开发人员解释称，强化学习是机器学习的一个分支，旨在让智能体在环境中通过试错来学习如何实现特定目标。这种方法是谷歌此前在“阿尔法零”等AI游戏上取得成功的关键。OpenAI则仅透露运用了强化学习与“实验性方法”，技术细节仍笼罩在迷雾中。菲尔兹奖得主、美国加州大学洛杉矶分校数学家陶哲轩评价道，这一进展令人振奋，但需要可复现的研究数据支撑。IMO金牌得主约瑟夫·梅耶指出，自然语言证明虽具可读性优势，但冗长论证可能带来验证困难。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签