快科技资讯 2024年11月18日
对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

月之暗面推出Kimi国产大模型的k0-math,采用新技术提升数学难题解决能力。在多项测试中表现优异,超过OpenAI部分模型,但存在一些局限性,公司表示会在后续迭代中改善。

🎯k0-math是Kimi推出的首款推理能力强化模型,采用新技术提升解题能力

📈在多项数学基准能力测试中,k0-math初代模型成绩超过OpenAI部分模型

⚠️k0-math存在无法解答LaTeX格式几何图形类问题等局限性

快科技11月18日消息,日前,国内人工智能公司月之暗面推出的Kimi国产大模型正式发布k0-math。

k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学难题的能力。

据了解,在多项数学基准能力测试中,k0-math的表现能对标OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。

根据官方公布的结果,在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中,k0-math初代模型成绩超过o1-mini和o1-preview模型,拿下第一。

在业界最常使用的数学能力基准测试MATH 中,k0-math模型得分93.8,超过 o1-mini的90分和o1-preview的85.5分。

官方表示,k0-math这一成绩仅次于暂未开放使用的o1完全版94.8分。

据介绍,常规模型的设定目标是尽快提供问题的答案,但k0-math不同,k0-math模型在做题过程中会花更长的时间来推理,包括思考和规划思路,并且在必要时自行反思改进解题思路,提升答题的成功率。

不过,月之暗面坦言,k0-math虽然擅长解答大部分很有难度的数学题,但是当前版本还无法解答LaTeX格式难以描述的几何图形类问题。

另外,k0-math还有一些局限性需要突破,包括对于过于简单的数学问题,例如1+1等于几,k0-math模型可能会过度思考,对于高考难题和IMO题目依然有一定概率做错、猜答案。

月之暗面表示,这些局限性既是机遇,也是挑战,预计将在下一阶段的模型迭代中逐步得到改善。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Kimi k0-math 数学难题 局限性
相关文章