小米大模型团队 2025-06-20 10:01 广西

你是否想过，当人工智能解决数学题时，是怎么一步步思考的？

现在的大型语言模型（比如能做数学推理的 AI），常用一种 “思维链” 方法 —— 就像人类做题时在纸上写步骤一样，AI 会逐字生成中间推理过程，最后给出答案。但这种 “逐字写下来” 的方式就像让 AI 用慢动作解题，效率很低。如何让 AI 高效思考，成为亟待解决的问题。

针对此问题，小米大模型 PLUS 团队与中国人民大学的研究团队合作提出了压缩隐空间推理（Compressed Latent Reasoning, CoLaR），即通过将多个词元（字符）压缩到一个连续的数字向量（隐空间变量）进行推理，类似人类“心算”而非在纸上逐字写下计算过程，进而提升推理效率。

在 GSM 系列数据集（小学难度数学题）上，相较基准模型，CoLaR 在使用更少推理步数的同时将解题成功率提升了 14.1%，相较逐字思考的思维链方法，CoLaR 仅以 4.8% 的正确率为代价，实现了 53.3% 的推理速度提升。

在更具挑战性的 MATH 数据集（大学难度数学题）上，经过强化学习训练后的 CoLaR 模型在正确率提升 5.36% 的同时，将推理链长度降低了 82.8%，首次证明了强化学习在隐变量推理领域的有效性。

论文

地址：

https://arxiv.org/pdf/2505.16552

训练代码：

https://github.com/xiaomi-research/CoLaR

模型权重：

https://huggingface.co/AlbertTan/CoLaR

01 方法详解

监督学习训练（左）以及强化学习训练（右）示意图

推理过程以及检索分析示意图

CoLaR 在推理过程中预测的隐变量可以有效地在数十万词元中检索出多个最有意义的词元，证明了思考过程预测的隐变量具有浓缩且有意义的推理信息。

▍推理压缩与理解

▍动态隐变量预测

▍强化学习调优

探索正确路径

偏好更简洁的推理过程

02 实验结果

▍主要实验

▍分析性试验

03 总结与展望

CoLaR 首次实现了动态调节压缩率的隐变量推理，让 AI 能像人类一样 “灵活心算”，突破了传统方法固定步数和缺乏探索的局限。尽管目前性能略低于传统显式推理，但团队认为通过扩大训练数据和迭代训练策略，有望实现质的突破。

未来研究将聚焦模型根据问题的难度自主选择压缩率，甚至在推理过程中动态调整压缩率，实现效果和效率的完美结合，进而推动大模型在高效推理场景中的实际应用。

END

01

方法详解

02

实验结果

03

总结与展望

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签