IT之家 2024年12月31日
2025 年考研数学一得 126 分,智谱深度推理模型 GLM-Zero 预览版上线
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

智谱官方发布了GLM-Zero的初代版本GLM-Zero-Preview,这是一个基于扩展强化学习技术训练的推理模型。该模型专注于增强AI的推理能力,擅长处理数理逻辑、代码和需要深度推理的复杂问题。相较于同基座模型,GLM-Zero-Preview在专家任务能力方面表现显著提升,在AIME 2024、MATH500和LiveCodeBench等评测中与OpenAI的o1-preview效果相当。尽管与OpenAI的o3模型仍有差距,但智谱表示将持续优化迭代强化学习技术,并计划推出正式版GLM-Zero,将深度思考能力扩展到更通用的技术领域。在数学方面,GLM-Zero-Preview展现出强大的归纳与演绎能力,能快速处理复杂的数学运算,例如2025年考研数学一的得分达到126分。

🚀GLM-Zero-Preview是智谱首个基于扩展强化学习技术训练的推理模型,专注于增强AI的推理能力,尤其擅长处理数理逻辑、代码和需要深度推理的复杂问题。

💡在专家任务能力方面,GLM-Zero-Preview相较于同基座模型表现大幅提升,并在AIME 2024、MATH500和LiveCodeBench等评测中,效果与OpenAI o1-preview相当,显示出其在特定领域的强大竞争力。

🧮在数学方面,GLM-Zero-Preview展现出强大的归纳与演绎能力,能够快速处理包括代数、微积分、概率统计等领域的复杂数学运算,如在2025年考研数学一中得分为126分,证明了其在数学推理方面的卓越性能。

IT之家 12 月 31 日消息,智谱官方今日发布 GLM-Zero 的初代版本 GLM-Zero-Preview,这是智谱首个基于扩展强化学习技术训练的推理模型

GLM-Zero-Preview 是 GLM 家族中专注于增强 AI 推理能力的模型,擅长处理数理逻辑、代码和需要深度推理的复杂问题。

据介绍,同基座模型相比,GLM-Zero-Preview 在不显著降低通用任务能力的情况下,在专家任务能力方面的表现大幅提升,其在 AIME 2024、MATH500 和 LiveCodeBench 评测中,效果与 OpenAI o1-preview 相当

官方表示,目前的 GLM-Zero-Preview 与 OpenAI 的 o3 模型还有不少的差距。将持续优化迭代强化学习技术。很快将会推出正式版 GLM-Zero,将深度思考的能力从数理逻辑扩展到更多更通用的技术。

在数学方面,GLM-Zero-Preview 具有强大的归纳与演绎能力,能够快速处理复杂的数学运算,解答包括代数、微积分、概率统计等领域的问题。

以 2025 年考研数学一为例,GLM-Zero-Preview 得分为 126。2025 年考研数学一卷最后一题推理与解答过程如下:

目前 GLM-Zero-Preview 已经上线,IT之家附体验地址如下:

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

GLM-Zero AI推理 强化学习 数理逻辑 智谱
相关文章