Google DeepMind团队发布了以Gemini Deep Think进阶版为代表的AI模型,成功挑战了国际数学奥林匹亚(IMO)竞赛。该模型在官方规定的时间内解决了5道题目,获得了与OpenAI相同的35分,并摘得金牌。与以往需要人工转换题目格式不同,Gemini Deep Think进阶版能够直接处理自然语言题目,并端到端生成数学证明。它通过平行思维、强化学习和高质量数学解题资料等技术,显著提升了多步推理和解题能力。该模型将首先对部分测试者开放,随后面向Google AI Ultra订阅用户。
🌟 Google DeepMind团队利用Gemini Deep Think进阶版AI模型,在国际数学奥林匹亚(IMO)竞赛中取得佳绩,与OpenAI一同获得金牌,总分同为35分。IMO竞赛要求高中生在两天内,每天用4.5小时解决3道不同领域的数学题,每题满分7分,今年金牌门槛为35分。
💡 与去年DeepMind团队需要AlphaGeometry和AlphaProof两个模型协同工作,并由人类专家将题目转换为形式语言(如Lean)才能处理不同,今年的Gemini Deep Think进阶版实现了自然语言端到端的处理,可以直接从官方问题描述生成数学证明,大大简化了流程。
🚀 Gemini Deep Think进阶版在技术上采用了增强推理模式,融合了“平行思维”技术,即在给出最终答案前探索和组合多种解决方案,而非单一的线性思考。同时,它还运用了创新的强化学习技术,提升了模型处理多步推理、解题及定理证明的能力。
📚 该模型还通过学习一套精选的高质量数学解题资料,并补充了针对IMO题目的提示与策略建议,进一步优化了其解题表现。Google计划首先将此先进模型开放给数学家等有限的测试者,之后再推广给Google AI Ultra的订阅用户。
📢 相比之下,OpenAI用于挑战数奥的模型目前仍处于实验性研究阶段,短期内不会对外发布。Gemini Deep Think进阶版的推出,标志着AI在解决复杂数学问题和参与高难度竞赛方面取得了新的突破。
不讓OpenAI專美於前,Google DeepMind團隊也在周一(7/21)宣布,他們以Gemini Deep Think進階版來挑戰今年的國際數學奧林匹亞(International Math Olympiad,IMO)競賽,同樣在官方要求的時間內解決了5道題目,得到與OpenAI同樣的35分,一起得到金牌。
IMO是一項針對高中生的全球性數學競賽,在兩天的競賽中各提供4.5小時的時間來解決涵蓋不同領域的3道數學題目,每道題最高為7分,金牌門檻每年不一,今年數奧甫於上周結束,金牌門檻為35分。
其實DeepMind早在去年就曾挑戰IMO,當時同時運用專門解幾何題的AlphaGeometry,以及負責代數、數論等其它題型的AlphaProof兩個模型。由於這兩個模型都無法直接處理自然語言題目,需要人類專家先將題目轉換成如Lean等形式語言,再餵給模型處理,因此整個過程通常得花上兩到三天。
今年的Gemini Deep Think進階版則能以自然語言端到端運行,直接從官方問題描述中生成嚴格的數學證明,並在4.5小時的比賽時限內完成。
Google解釋,Gemini Deep Think進階版為一針對複雜問題的增強推理模式,融合某些最新研究技術,例如平行思維,它讓模型在給出最終答案之前同時探索及組合多種可能的解決方案,而非追求單一的線性思維鏈;亦採用創新的強化學習技術,提升 Gemini處理多步推理、解題與定理證明的能力;還讓Gemini學習一套精選的高品質數學解題資料,並補充針對IMO題目的提示與策略建議。
此一Gemini Deep Think進階版將率先開放給數學家等有限的測試者,之後才會開放給Google AI Ultra訂閱者。相較之下,OpenAI用來挑戰數奧的模型仍只是個實驗性的研究模型,至少在幾個月內都不會釋出。