DeepSeek 2024年10月28日
全球首届 AI 奥数竞赛,DeepSeekMath 成为 TOP 团队的共同选择
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

近日,首届人工智能数学奥林匹克竞赛(AIMO)公布了获奖名单,令人惊喜的是,前四名队伍都选择了DeepSeekMath-7B作为基础模型,并取得了出色的成绩。DeepSeekMath-7B是一个7B参数的模型,在MATH基准测试中超过了众多30B~70B的开源模型,展现了强大的数学推理能力。AIMO共包含110道类似高中数学竞赛中等难度的题目,第一名团队Numina的模型在公开和私有测试集上分别达到了29/50和3/50的正确率,这令数学大神陶哲轩也感到惊叹。这一结果表明,AI的数学能力已经具备了参加国际数学奥赛(IMO)的潜力。

🎉 DeepSeekMath-7B在首届人工智能数学奥林匹克竞赛(AIMO)中表现出色,前四名获奖团队都选择了它作为基础模型。

🏆 AIMO共包含110道类似高中数学竞赛中等难度的题目,第一名团队Numina的模型在公开和私有测试集上分别达到了29/50和3/50的正确率,展现了强大的数学推理能力。

🚀 DeepSeekMath-7B是一个7B参数的模型,在MATH基准测试中超过了众多30B~70B的开源模型,证明了其在数学领域的强大潜力。

💡 获奖团队通过不同的微调策略和方法,充分发挥了DeepSeekMath-7B的优势,例如使用SFT和在线强化学习算法KTO混合微调、使用多个模型协作等。

🌟 这一结果表明,AI在数学领域的发展已经取得了显著的进步,AI的数学能力已经具备了参加国际数学奥赛(IMO)的潜力。

🤝 DeepSeek团队通过开源模型,推动了技术交流与模型能力探索,为AI数学领域的发展贡献了力量。

🚀 未来,DeepSeek团队将继续打造性能更强大的模型,推动人工智能发展的新篇章。

原创 深度求索 2024-07-10 20:32 北京

祝贺所有获奖队伍!

历时 3 月,在 Kaggle 社区上进行的全球首届人工智能数学奥林匹克竞赛(AIMO)于近日公布了进步奖获奖名单,在人工智能圈引起广泛关注。

我们惊喜地发现,获奖的 Top4 团队不约而同地都选择了 DeepSeekMath-7B 作为基础模型,并且取得了出乎意料的准确率。

以下为获奖名单:

link:https://www.kaggle.com/competitions/ai-mathematical-olympiad-prize/leaderboard

AIMO 共包含 110 道题目,类似于高中数学竞赛中等难度的试题, Gemma 7B 在公开和私有测试集上的得分是 3/50,而本次获得第一名的 Numina,达到了 29/50 的正确率。这一结果,也令数学大神陶哲轩惊叹。

AI 的数学能力已经具备了 IMO(国际数学奥赛)候选人资质。

TOP4 获奖团队公布的模型细节:

?第一名:

我们提交的最佳方案是用 SFT 和在线强化学习算法 KTO 混合微调 deepseek-math-7b-base。

?第二名:

我们微调了两个 DeepSeek-Math-7B-RL 模型,一个用作策略模型(生成答案),另一个作为奖励模型,对回答进行评分以调整答案的顺序。

?第三名:

我们使用了未经微调的 DeepSeek-Math-7B-RL 模型,并通过我们制定的评分规则使用多数投票的策略选择正确答案。

?第四名:

我们使用了 DeepSeek-Math-7B-RL,参数设置为:温度 0.9,top_p 为 1.0,最大 Token 数 2048。此模型结合了代码工具,在 MATH 基准测试中能达到 58.8% 的准确率。


虽然目前仍有较多团队未公开具体方案,但很高兴通过开源模型的方式推动了技术交流与模型能力探索,这也是最初我们选择开源的重要动力,并且这一竞赛结果也很好地佐证了 DeepSeekMath 的能力。

点击跳转:DeepSeekMath,一个 7B 模型但有逼近 GPT-4 的数学推理能力,在 MATH 基准榜单上超过一众 30B~70B 的开源模型。(发布于 2024 年 2 月 6 日)

再次祝贺所有获奖队伍!

目前,DeepSeek-Coder-V2 已经集成了 DeepSeekMath 的数学能力。欢迎前往官网免费体验【代码助手 V2】或至开放平台调用 deepseek-coder。

访问官网:coder.deepseek.com

访问开放平台:platform.deepseek.com

未来,我们将会继续打造性能更强大的模型,我们相信,只有强大的模型能力、普惠的技术应用,才能开启人工智能发展的新篇章。

我们共同的星辰大海是 AGI。


跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeekMath 人工智能 数学奥赛 AI数学 开源模型
相关文章