云启资本 前天 18:05
MiniMax开源超强性价比推理模型,未来四天连续“上新” | 云启伙伴
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

大模型独角兽MiniMax发布全球首个开源大规模混合架构推理模型MiniMax-M1,该模型在多项基准测试中表现出色,超越或比肩DeepSeek-R1、Qwen3等开源模型。M1具备业内领先的算力优势,尤其在长文本处理方面表现突出,支持100万上下文输入,并以高性价比的API服务。MiniMax团队通过闪电注意力机制和强化学习算法CISPO,实现了高效的训练和推理,并将在未来几天持续更新。

⚡️MiniMax-M1是全球首个开源大规模混合架构推理模型,在多个基准测试中表现出色,超越或比肩DeepSeek-R1、Qwen3等开源模型。

📝M1支持业内最高的100万上下文输入,是DeepSeekR1的8倍,推理输出上限达到8万Token,达到业内最长水平,尤其适用于社交应用、情感陪伴应用和Agent等。

💡MiniMax-M1的长文本能力得益于闪电注意力机制为主的混合架构,该架构在长文本上下文输入和深度推理时均有算力效率优势。

🚀MiniMax采用强化学习算法CISPO,通过裁剪重要性采样权重提升强化学习效率,与混合架构创新共同促成M1高效的强化训练过程。

💰M1在MiniMax APP 和 Web 上均可不限量免费使用,并以业内最低的价格在官网提供API,性价比优于DeepSeek-R1的用户方案。

2025-06-17 10:55 北京

创新脚步不停

创新力量的迭代脚步从未停息。继一个月前上新语音模型Orsta系列模型后云启天使轮项目、大模型独角兽MiniMax宣布将连续五天发布重要更新。开场第一弹,是开源的首个推理模型——MiniMax-M1。

这也是全球首个开源大规模混合架构推理模型,多项基准测试超越或比肩DeepSeek-R1、Qwen3等多个开源模型。同时,鉴于两大重要技术创新,MiniMax-M1实现了业内领先的算力优势,性价比满满。一起在本期「云启伙伴」了解详情。

云启天使轮项目、大模型独角兽MiniMax开源推理模型“上新”。

6月17日,MiniMax 发布全球首个开源大规模混合架构的推理模型MiniMax-M1,并宣布在未来四个工作日连续更新。

据MiniMax介绍,M1在面向生产力的复杂场景中位处开源模型第一梯队,超过国内的闭源模型,接近海外的最领先模型,同时极具性价比。

长本文是M1的一个显著优势,其支持目前业内最高的100万上下文的输入,这一长度是DeepSeekR1的8倍,比肩闭源模型 Google Gemini 2.5 Pro ;推理输出上限则达到8万Token,达到业内最长水平。

“无限长的长文本能力是MiniMax团队一直在打磨的重要维度,对于做社交应用、情感陪伴应用,Agent等来说是很关键的技术。”云启合伙人陈昱在6月中旬举办的Waves 2025大会论坛上曾如是分析。

MiniMax-M1的长文本能力得益于一个重要技术创新——闪电注意力机制为主的混合架构。这一架构使得M1在进行长本文的上下文输入和深度推理时均有算力效率优势突出。MiniMax举例称,在用8万Token深度推理的时候,只需要使用DeepSeek R1约30%的算力。

另一大技术创新是强化学习算法CISPO,该算法通过裁剪重要性采样权重(而非传统token更新)提升了强化学习效率,与混合架构创新共同促成M1高效的强化训练过程。科技媒体“量子位”报道显示,MiniMax团队透露,只用了3周时间、512块H800 GPU就完成强化学习训练阶段,算力租用成本仅53.47万美元(约383.9万元)。

* M1在业内主流 17 个评测集上的测评结果

基于相对高效的训练和推理算力,MiniMax 宣布,M1在MiniMax APP 和 Web 上都保持不限量免费使用,并以业内最低的价格在官网提供API,提供了性价比优于DeepSeek-R1的用户方案。

风易变,规律常在。纵然AI行业瞬息万变,相信机会属于持续探索技术边界的行动实干派。未来四天,欢迎关注MiniMax的更多更新,期待MiniMax推动AGI更多创新!

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MiniMax 开源模型 推理模型 长文本 性价比
相关文章