百度集团副总裁吴甜:融合思考和行动的复合思维链,大幅提升模型解决问题能力。
5月20日,百度AI Day活动在北京举办。活动现场,根据中国信通院发布的大模型推理能力评估结果显示,百度文心X1 Turbo在24项能力评估中,16项达5分、7项达4分、1项达3分,综合评级获当前最高级“4+级”,成为国内首款通过该测评的大模型。
据了解,文心X1 Turbo是一款基于百度文心4.5 Turbo的深度思考模型,于今年4月底在百度Create开发者大会上发布。在性能提升的同时,具备更先进的思维链,问答、创作、逻辑推理、工具调用和多模态能力进一步增强。价格更低,每百万token输入价格为1元,输出价格为4元,仅为DeepSeek-R1的25%。
活动现场,百度集团副总裁吴甜表示,当前百度在文心大模型的技术创新上进行了进一步的探索。深度思考方面,突破了仅基于思维链优化的范式,在思考路径中结合工具调用,构建了融合思考和行动的复合思维链,模型解决问题能力得到显著提升,模型输出结果思路清晰、逻辑严密,表达自然。同时,结合多元统一的奖励机制,实现了思考和行动链的端到端优化,大幅提升了跨领域的问题解决能力。