Cnbeta 01月24日
中国联通发布元景思维链大模型 性能比肩OpenAI
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

中国联通发布了央企首个开源通用思维链大模型——元景思维链,该模型已在多个社区全面开源。它不仅具备强大的慢思考能力,还拥有跨学科、多场景的通用推理能力,并能根据任务和难度自适应调整思考模式,从而降低资源消耗。测评结果显示,元景思维链大模型的性能超越了当前顶尖的通用语言模型,如OpenAI GPT-4o和Deepseek V3,以及开源思维链模型通义千问QwQ。该模型通过任务自适应和难度自适应策略实现“自适应慢思考”,并在保证正确率的前提下,倾向于生成更短的答案。此外,模型还能根据问题难度调整答案长度,可顺利解答高考真题、24点游戏等复杂问题。

🚀 元景思维链大模型是中国联通发布的央企首个开源通用思维链大模型,具备强大的慢思考能力和多学科通用推理能力,已在GitHub、魔搭等社区全面开源。

🧠 该模型采用任务自适应和难度自适应策略,实现模型的“自适应慢思考”,能够根据任务类型和难度调整思考模式,有效降低资源消耗,并在非推理任务测评中倾向于生成更短的答案。

🏆 主流榜单测评显示,元景思维链大模型性能超越了OpenAI GPT-4o、Deepseek V3以及通义千问QwQ等顶尖模型,在解答物理、化学高考真题、24点游戏等复杂问题上表现出色。

今日,中国联通宣布,联通数据智能有限公司日前发布元景思维链大模型。目前,元景思维链模型已在GitHub魔搭始智等社区全面开源。作为央企首个开源的通用思维链大模型,元景思维链大模型既拥有强大慢思考能力,又具备不限于数学的多学科、多场景通用推理能力,且能做到针对不同任务和难度的自适应慢思考,大幅降低资源消耗。

中国联通表示,主流榜单的测评结果显示,元景思维链大模型的表现超过了目前最好的通用语言模型(OpenAI GPT-4o和Deepseek V3)以及开源思维链模型通义千问QwQ。 

据介绍,元景思维链大模型通过任务自适应和难度自适应两种策略来实现模型的“自适应慢思考”。

在非推理任务测评集上对比,元景思维链模型在保证正确率的情况下明显倾向于生成更短的答案(长度小于100和200个token的数量明显多于通义千问QwQ):

该大模型在评估模型生成的长思维链数据时,除了考虑生成的答案正确与否,还综合考虑了问题的难度以及生成答案的长度,通过强化学习让模型将答案长度与当前问题的难度相匹配。

根据官方演示,元景思维链模型可顺利解答物理、化学高考真题、24点游戏、逻辑推理等问题。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

元景思维链 开源模型 通用推理 自适应慢思考 中国联通
相关文章