华为宣布开源盘古7B稠密和72B混合专家模型

快科技资讯 06月30日 09:36

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

华为正式开源盘古70亿参数稠密模型、盘古Pro MoE 720亿参数混合专家模型，以及基于昇腾的模型推理技术。此举旨在推动大模型技术发展，加速人工智能在各行业的应用。盘古Pro MoE大模型在昇腾300I Duo和800I A2上表现出优异的计算效率。在SuperCLUE榜单上，盘古Pro MoE以72B总参数量取得59分，与千亿参数量以内大模型并列国内第一，展现出强大的模型能力。

🚀 华为开源了盘古70亿参数稠密模型、盘古Pro MoE 720亿参数混合专家模型，以及基于昇腾的模型推理技术，此举是华为昇腾生态战略的重要一步，旨在推动大模型技术发展。

💻 盘古Pro MoE大模型基于MoE架构构建，总参数量为720亿，激活参数量160亿。在昇腾300I Duo和800I A2上，该模型实现了更优的专家负载分布与计算效率，分别达到321 tokens/s和1528 tokens/s。

🥇 在业界权威大模型榜单SuperCLUE上，盘古Pro MoE以72B总参数量取得了59分，与千亿参数量以内大模型并列国内第一，展现出强大的模型能力，其160亿激活参数量可与更大规模的模型媲美。

🌐 开源内容包括盘古Pro MoE 72B模型权重、基础推理代码，以及基于昇腾的超大规模MoE模型推理代码。盘古7B相关模型权重与推理代码也将于近期上线开源平台，为开发者提供更多选择。

快科技6月30日消息，华为今日正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术。

华为表示：“此举是华为践行昇腾生态战略的又一关键举措，推动大模型技术的研究与创新发展，加速推进人工智能在千行百业的应用与价值创造。”

根据华为官网显示：

盘古Pro MoE 72B模型权重、基础推理代码，已正式上线开源平台。

基于昇腾的超大规模MoE模型推理代码，已正式上线开源平台。

盘古7B相关模型权重与推理代码将于近期上线开源平台。

据悉，基于MoGE架构构建的盘古Pro MoE大模型（72B总参数、16B激活参数）在昇腾300I Duo和800I A2可实现更优的专家负载分布与计算效率（321 tokens/s和1528 tokens/s）。

而在模型能力方面，盘古Pro MoE在最新一期业界权威大模型榜单SuperCLUE上交出了超能打的成绩。

和其他动辄千亿以上的大模型相比，如DeepSeek-R1具有671B参数，盘古Pro MoE以72B总参数量达到了59分，千亿参数量以内大模型排行并列国内第一。

并且，16B激活参数量可以媲美其他厂商更大规模的模型。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签