中国联通发布了央企首个开源通用思维链大模型——元景思维链,该模型已在多个社区开源。它不仅具备强大的慢思考能力,还能在多学科、多场景下进行通用推理,并能根据任务和难度自适应调整思考方式,从而降低资源消耗。测评显示,元景思维链大模型的性能超越了GPT-4o、Deepseek V3以及通义千问QwQ等主流模型。其核心在于任务自适应和难度自适应策略,使模型在保证正确率的同时,倾向于生成更简洁的答案,并通过强化学习实现答案长度与问题难度的匹配。该模型能够解决物理、化学高考真题、24点游戏、逻辑推理等复杂问题。
🚀 **央企首发开源**: 元景思维链大模型是中国联通推出的首个央企开源通用思维链大模型,标志着央企在人工智能领域的重要进展。
🧠 **强大通用推理**: 该模型不仅拥有强大的慢思考能力,还在数学等多学科、多场景中展现出通用推理能力,适用范围广泛。
⚙️ **自适应慢思考**: 元景思维链大模型能根据任务和难度进行自适应慢思考,有效降低资源消耗,提高效率。
🏆 **性能超越**: 测评结果显示,元景思维链大模型的性能超越了GPT-4o、Deepseek V3以及通义千问QwQ等主流模型,展现出卓越的竞争力。
🎯 **答案优化**: 模型通过强化学习优化答案生成,在保证正确率的前提下,倾向于生成更简洁的答案,并使答案长度与问题难度相匹配。
快科技1月24日消息,今日,中国联通宣布,联通数据智能有限公司日前发布元景思维链大模型。
目前,元景思维链模型已在GitHub、魔搭、始智等社区全面开源。
作为央企首个开源的通用思维链大模型,元景思维链大模型既拥有强大慢思考能力,又具备不限于数学的多学科、多场景通用推理能力,且能做到针对不同任务和难度的自适应慢思考,大幅降低资源消耗。
中国联通表示,主流榜单的测评结果显示,元景思维链大模型的表现超过了目前最好的通用语言模型(OpenAI GPT-4o和Deepseek V3)以及开源思维链模型通义千问QwQ。


据介绍,元景思维链大模型通过任务自适应和难度自适应两种策略来实现模型的“自适应慢思考”。
在非推理任务测评集上对比,元景思维链模型在保证正确率的情况下明显倾向于生成更短的答案(长度小于100和200个token的数量明显多于通义千问QwQ):
该大模型在评估模型生成的长思维链数据时,除了考虑生成的答案正确与否,还综合考虑了问题的难度以及生成答案的长度,通过强化学习让模型将答案长度与当前问题的难度相匹配。
根据官方演示,元景思维链模型可顺利解答物理、化学高考真题、24点游戏、逻辑推理等问题。






