Cnbeta 07月03日
上海MiniMax开源模型登上全球第二 创始人:第一次感觉到大山不是不能翻越
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

上海人工智能公司MiniMax发布全球首个开源大规模混合架构推理模型MiniMax-M1,该模型在权威评测中位列全球开源模型第二。M1在长文本处理和工具调用方面表现出色,支持高达100万token的上下文输入,性能接近谷歌Gemini 2.5 Pro。MiniMax在研发成本远低于行业平均水平的情况下,展现出惊人的研发速度和产品化能力,并在M1发布后迅速推出多款创新产品。公司坚持通用人工智能(AGI)领域的技术路线,最终实现了具有里程碑意义的技术突破。

🚀 MiniMax-M1是一款全球首个开源大规模混合架构推理模型,在权威评测榜单中排名全球开源模型第二,展现出强大的技术实力。

📝 M1在长文本处理能力上表现突出,支持高达100万token的上下文输入,性能是DeepSeek同类模型的8倍,甚至可与谷歌最新闭源模型Gemini 2.5 Pro相媲美。

💰 值得关注的是,M1在强化学习阶段的投入仅为53.5万美元,远低于行业常规的千万级研发成本,显示出MiniMax高效的研发能力。

💡 MiniMax在M1发布后迅速推出多款创新产品,包括视频生成模型、通用智能体和音色设计工具,保持着“日更”的节奏,展现出强大的产品化能力。

🌱 MiniMax坚持通用人工智能(AGI)的技术路线,并在大模型研发领域取得突破,这得益于其在大模型稠密架构和传统注意力机制上的战略选择。

在官网和开源平台GitHub上,上海国产AI独角兽MiniMax抛出全球首个开源大规模混合架构推理模型——MiniMax-M1。该模型在权威评测榜单已位列全球开源模型第二。M1发布当天,MiniMax创始人兼CEO闫俊杰在朋友圈写下:第一次感觉到大山不是不能翻越。

M1一登场,即在权威评测榜单中位列全球开源模型第二,仅次于5月28日发布的DeepSeek-R1-0528。不过从细分项来看,M1在长文本处理、工具调用等方面形成碾压级优势。

M1支持高达100万token的上下文输入能力,相当于可以一次性处理整部《三体》英文原著,这一性能达到DeepSeek同类模型的8倍,甚至可与谷歌最新闭源模型Gemini2.5Pro相媲美。更令人瞩目的是,在保持顶尖性能的同时,其强化学习阶段仅投入53.5万美元,远低于行业常规的千万级研发成本。

MiniMax展现出惊人的研发速度和产品化能力。在M1发布后的短短四个工作日内,公司连续推出视频生成模型Hailuo 02、通用智能体MiniMax Agent、视频创作智能体Hailuo Video Agent以及音色设计工具Voice Design等多款创新产品,保持着令人瞩目的"日更"节奏。

这家扎根上海徐汇的AI企业始终保持着独特的技术路线。早在2022年底ChatGPT引发全球关注之前,MiniMax就已布局通用人工智能(AGI)领域,并果断放弃当时主流的大模型稠密架构和传统注意力机制。在全球大模型研发企业普遍收缩的行业背景下,MiniMax逆势坚持基础模型研发的战略选择,最终换来了这次具有里程碑意义的技术突破。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MiniMax M1模型 开源 人工智能 AGI
相关文章