Google Gemini Deep Think也突破今年數奧金牌門檻

AI & Big Data 07月22日 11:23

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

Google DeepMind团队发布了以Gemini Deep Think进阶版为代表的AI模型，成功挑战了国际数学奥林匹亚（IMO）竞赛。该模型在官方规定的时间内解决了5道题目，获得了与OpenAI相同的35分，并摘得金牌。与以往需要人工转换题目格式不同，Gemini Deep Think进阶版能够直接处理自然语言题目，并端到端生成数学证明。它通过平行思维、强化学习和高质量数学解题资料等技术，显著提升了多步推理和解题能力。该模型将首先对部分测试者开放，随后面向Google AI Ultra订阅用户。

🌟 Google DeepMind团队利用Gemini Deep Think进阶版AI模型，在国际数学奥林匹亚（IMO）竞赛中取得佳绩，与OpenAI一同获得金牌，总分同为35分。IMO竞赛要求高中生在两天内，每天用4.5小时解决3道不同领域的数学题，每题满分7分，今年金牌门槛为35分。

💡 与去年DeepMind团队需要AlphaGeometry和AlphaProof两个模型协同工作，并由人类专家将题目转换为形式语言（如Lean）才能处理不同，今年的Gemini Deep Think进阶版实现了自然语言端到端的处理，可以直接从官方问题描述生成数学证明，大大简化了流程。

🚀 Gemini Deep Think进阶版在技术上采用了增强推理模式，融合了“平行思维”技术，即在给出最终答案前探索和组合多种解决方案，而非单一的线性思考。同时，它还运用了创新的强化学习技术，提升了模型处理多步推理、解题及定理证明的能力。

📚 该模型还通过学习一套精选的高质量数学解题资料，并补充了针对IMO题目的提示与策略建议，进一步优化了其解题表现。Google计划首先将此先进模型开放给数学家等有限的测试者，之后再推广给Google AI Ultra的订阅用户。

📢 相比之下，OpenAI用于挑战数奥的模型目前仍处于实验性研究阶段，短期内不会对外发布。Gemini Deep Think进阶版的推出，标志着AI在解决复杂数学问题和参与高难度竞赛方面取得了新的突破。

不讓OpenAI專美於前，Google DeepMind團隊也在周一（7/21）宣布，他們以Gemini Deep Think進階版來挑戰今年的國際數學奧林匹亞（International Math Olympiad，IMO）競賽，同樣在官方要求的時間內解決了5道題目，得到與OpenAI同樣的35分，一起得到金牌。

IMO是一項針對高中生的全球性數學競賽，在兩天的競賽中各提供4.5小時的時間來解決涵蓋不同領域的3道數學題目，每道題最高為7分，金牌門檻每年不一，今年數奧甫於上周結束，金牌門檻為35分。

其實DeepMind早在去年就曾挑戰IMO，當時同時運用專門解幾何題的AlphaGeometry，以及負責代數、數論等其它題型的AlphaProof兩個模型。由於這兩個模型都無法直接處理自然語言題目，需要人類專家先將題目轉換成如Lean等形式語言，再餵給模型處理，因此整個過程通常得花上兩到三天。

今年的Gemini Deep Think進階版則能以自然語言端到端運行，直接從官方問題描述中生成嚴格的數學證明，並在4.5小時的比賽時限內完成。

Google解釋，Gemini Deep Think進階版為一針對複雜問題的增強推理模式，融合某些最新研究技術，例如平行思維，它讓模型在給出最終答案之前同時探索及組合多種可能的解決方案，而非追求單一的線性思維鏈；亦採用創新的強化學習技術，提升 Gemini處理多步推理、解題與定理證明的能力；還讓Gemini學習一套精選的高品質數學解題資料，並補充針對IMO題目的提示與策略建議。

此一Gemini Deep Think進階版將率先開放給數學家等有限的測試者，之後才會開放給Google AI Ultra訂閱者。相較之下，OpenAI用來挑戰數奧的模型仍只是個實驗性的研究模型，至少在幾個月內都不會釋出。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签