上海MiniMax开源模型登上全球第二创始人：第一次感觉到大山不是不能翻越

Cnbeta 07月03日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

上海人工智能公司MiniMax发布全球首个开源大规模混合架构推理模型MiniMax-M1，该模型在权威评测中位列全球开源模型第二。M1在长文本处理和工具调用方面表现出色，支持高达100万token的上下文输入，性能接近谷歌Gemini 2.5 Pro。MiniMax在研发成本远低于行业平均水平的情况下，展现出惊人的研发速度和产品化能力，并在M1发布后迅速推出多款创新产品。公司坚持通用人工智能(AGI)领域的技术路线，最终实现了具有里程碑意义的技术突破。

🚀 MiniMax-M1是一款全球首个开源大规模混合架构推理模型，在权威评测榜单中排名全球开源模型第二，展现出强大的技术实力。

📝 M1在长文本处理能力上表现突出，支持高达100万token的上下文输入，性能是DeepSeek同类模型的8倍，甚至可与谷歌最新闭源模型Gemini 2.5 Pro相媲美。

💰 值得关注的是，M1在强化学习阶段的投入仅为53.5万美元，远低于行业常规的千万级研发成本，显示出MiniMax高效的研发能力。

💡 MiniMax在M1发布后迅速推出多款创新产品，包括视频生成模型、通用智能体和音色设计工具，保持着“日更”的节奏，展现出强大的产品化能力。

🌱 MiniMax坚持通用人工智能（AGI）的技术路线，并在大模型研发领域取得突破，这得益于其在大模型稠密架构和传统注意力机制上的战略选择。

在官网和开源平台GitHub上，上海国产AI独角兽MiniMax抛出全球首个开源大规模混合架构推理模型——MiniMax-M1。该模型在权威评测榜单已位列全球开源模型第二。M1发布当天，MiniMax创始人兼CEO闫俊杰在朋友圈写下：第一次感觉到大山不是不能翻越。

M1一登场，即在权威评测榜单中位列全球开源模型第二，仅次于5月28日发布的DeepSeek-R1-0528。不过从细分项来看，M1在长文本处理、工具调用等方面形成碾压级优势。

M1支持高达100万token的上下文输入能力，相当于可以一次性处理整部《三体》英文原著，这一性能达到DeepSeek同类模型的8倍，甚至可与谷歌最新闭源模型Gemini2.5Pro相媲美。更令人瞩目的是，在保持顶尖性能的同时，其强化学习阶段仅投入53.5万美元，远低于行业常规的千万级研发成本。

MiniMax展现出惊人的研发速度和产品化能力。在M1发布后的短短四个工作日内，公司连续推出视频生成模型Hailuo 02、通用智能体MiniMax Agent、视频创作智能体Hailuo Video Agent以及音色设计工具Voice Design等多款创新产品，保持着令人瞩目的"日更"节奏。

这家扎根上海徐汇的AI企业始终保持着独特的技术路线。早在2022年底ChatGPT引发全球关注之前，MiniMax就已布局通用人工智能(AGI)领域，并果断放弃当时主流的大模型稠密架构和传统注意力机制。在全球大模型研发企业普遍收缩的行业背景下，MiniMax逆势坚持基础模型研发的战略选择，最终换来了这次具有里程碑意义的技术突破。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签