MiniMax开源超强性价比推理模型，未来四天连续“上新”

云启资本前天 18:05

MiniMax开源超强性价比推理模型，未来四天连续“上新” | 云启伙伴

大模型独角兽MiniMax发布全球首个开源大规模混合架构推理模型MiniMax-M1，该模型在多项基准测试中表现出色，超越或比肩DeepSeek-R1、Qwen3等开源模型。M1具备业内领先的算力优势，尤其在长文本处理方面表现突出，支持100万上下文输入，并以高性价比的API服务。MiniMax团队通过闪电注意力机制和强化学习算法CISPO，实现了高效的训练和推理，并将在未来几天持续更新。

⚡️MiniMax-M1是全球首个开源大规模混合架构推理模型，在多个基准测试中表现出色，超越或比肩DeepSeek-R1、Qwen3等开源模型。

📝M1支持业内最高的100万上下文输入，是DeepSeekR1的8倍，推理输出上限达到8万Token，达到业内最长水平，尤其适用于社交应用、情感陪伴应用和Agent等。

💡MiniMax-M1的长文本能力得益于闪电注意力机制为主的混合架构，该架构在长文本上下文输入和深度推理时均有算力效率优势。

🚀MiniMax采用强化学习算法CISPO，通过裁剪重要性采样权重提升强化学习效率，与混合架构创新共同促成M1高效的强化训练过程。

💰M1在MiniMax APP 和 Web 上均可不限量免费使用，并以业内最低的价格在官网提供API，性价比优于DeepSeek-R1的用户方案。

2025-06-17 10:55 北京

创新脚步不停

创新力量的迭代脚步从未停息。继一个月前上新语音模型、Orsta系列模型后，云启天使轮项目、大模型独角兽MiniMax宣布将连续五天发布重要更新。开场第一弹，是开源的首个推理模型——MiniMax-M1。

这也是全球首个开源大规模混合架构推理模型，多项基准测试超越或比肩DeepSeek-R1、Qwen3等多个开源模型。同时，鉴于两大重要技术创新，MiniMax-M1实现了业内领先的算力优势，性价比满满。一起在本期「云启伙伴」了解详情。

云启天使轮项目、大模型独角兽MiniMax开源推理模型“上新”。

6月17日，MiniMax 发布全球首个开源大规模混合架构的推理模型MiniMax-M1，并宣布在未来四个工作日连续更新。

据MiniMax介绍，M1在面向生产力的复杂场景中位处开源模型第一梯队，超过国内的闭源模型，接近海外的最领先模型，同时极具性价比。

长本文是M1的一个显著优势，其支持目前业内最高的100万上下文的输入，这一长度是DeepSeekR1的8倍，比肩闭源模型 Google Gemini 2.5 Pro ；推理输出上限则达到8万Token，达到业内最长水平。

“无限长的长文本能力是MiniMax团队一直在打磨的重要维度，对于做社交应用、情感陪伴应用，Agent等来说是很关键的技术。”云启合伙人陈昱在6月中旬举办的Waves 2025大会论坛上曾如是分析。

MiniMax-M1的长文本能力得益于一个重要技术创新——闪电注意力机制为主的混合架构。这一架构使得M1在进行长本文的上下文输入和深度推理时均有算力效率优势突出。MiniMax举例称，在用8万Token深度推理的时候，只需要使用DeepSeek R1约30%的算力。

另一大技术创新是强化学习算法CISPO，该算法通过裁剪重要性采样权重（而非传统token更新）提升了强化学习效率，与混合架构创新共同促成M1高效的强化训练过程。科技媒体“量子位”报道显示，MiniMax团队透露，只用了3周时间、512块H800 GPU就完成强化学习训练阶段，算力租用成本仅53.47万美元（约383.9万元）。

* M1在业内主流 17 个评测集上的测评结果

基于相对高效的训练和推理算力，MiniMax 宣布，M1在MiniMax APP 和 Web 上都保持不限量免费使用，并以业内最低的价格在官网提供API，提供了性价比优于DeepSeek-R1的用户方案。

风易变，规律常在。纵然AI行业瞬息万变，相信机会属于持续探索技术边界的行动实干派。未来四天，欢迎关注MiniMax的更多更新，期待MiniMax推动AGI更多创新！