阶跃星辰发布新一代基础大模型 Step 3，华为昇腾芯片已首先实现搭载

IT之家 07月26日 07:40

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

阶跃星辰在2025世界人工智能大会前夕发布了新一代基础大模型Step 3，并将于7月31日开源。Step 3是其首个全尺寸、原生多模态推理模型，采用MoE架构，总参数量321B，激活参数量38B。该模型在视觉感知和复杂推理方面表现出色，并在多项榜单上取得SOTA成绩。尤为突出的是，Step 3在架构设计上充分考虑了硬件特性，实现了广泛硬件平台上的高效推理，尤其在中低端及国产芯片上具有显著优势，推理效率最高可达DeepSeek-R1的300%。阶跃星辰还联合多家芯片厂商发起“模芯生态创新联盟”，旨在推动AI模型与硬件的协同发展。

🌟 **Step 3：原生多模态推理模型，性能与成本的平衡** 阶跃星辰发布的新一代基础大模型Step 3，定位为全尺寸、原生多模态推理模型，并在模型效果与推理成本之间取得了良好的平衡。其采用MoE（Mixture of Experts）架构，拥有321B的总参数量和38B的激活参数量，具备强大的视觉感知和跨领域知识理解能力，能够准确处理复杂的数学与视觉信息交叉分析，以及日常视觉分析任务。模型在MMMU、MathVision等多个权威榜单上均刷新了开源多模态推理模型的SOTA纪录。

🚀 **硬件适配与效率提升：国产芯片的强力助推** Step 3在设计之初就充分考虑了系统与硬件的特性，旨在实现跨平台的高效推理，特别是针对中低端及国产芯片进行了优化。与以往主要适配国际高端芯片的优化方案不同，Step 3在国产芯片上的推理效率最高可达DeepSeek-R1的300%，并且对所有芯片都表现出良好的兼容性。即便是在NVIDIA Hopper架构芯片上进行分布式推理，Step 3的吞吐量相较于DeepSeek-R1也提升了70%以上，这些提升均在不牺牲模型性能的前提下实现。

🤝 **“模芯生态创新联盟”：构建AI软硬件协同新生态** 为进一步推动AI模型与硬件的协同发展，阶跃星辰联合了包括华为昇腾、沐曦、壁仞科技、燧原科技等在内的近10家芯片及基础设施厂商，共同发起了“模芯生态创新联盟”。该联盟旨在汇聚产业力量，加速AI大模型在不同硬件平台上的适配和优化，促进生态繁荣。目前，华为昇腾芯片已率先完成Step 3的搭载和运行，沐曦、天数智芯、燧原等厂商也已初步实现运行，其他联盟成员的适配工作也在积极推进中。

IT之家 7 月 26 日消息，在 2025 世界人工智能大会（简称“WAIC 2025”）开幕前夕，阶跃星辰昨天在上海正式发布了新一代基础大模型 ——Step 3，将于 7 月 31 日面向全球企业和开发者开源。

据官方介绍，Step 3 是阶跃星辰首个全尺寸、原生多模态推理模型，兼顾模型效果与推理成本，是在模型架构创新、算法工程协同设计上的一次大胆尝试与 Scale Up。Step 3 采用 MoE 架构，总参数量 321B，激活参数量 38B。

Step 3 拥有强大的视觉感知和复杂推理能力，可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析，以及日常生活中的各类视觉分析问题。

Step 3 在 MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜单上取得了开源多模态推理模型的 SOTA 成绩。

官方称，目前，主流开源模型虽然针对解码进行了大量优化，但其优化方案主要适配国际高端芯片，在中端及国产芯片上的解码效率仍有提升空间。在架构设计阶段，Step 3 便充分考量系统与硬件的特性，实现广泛硬件平台上的高效推理。凭借系统和架构创新，Step 3 实现了行业领先的推理解码效率。

根据原理分析，Step 3 在国产芯片上的推理效率最高可达 DeepSeek-R1 的 300%，且对所有芯片友好。在基于 NVIDIA Hopper 架构的芯片进行分布式推理时，实测 Step 3 相较于 DeepSeek-R1 的吞吐量提升超 70%。这些都是在不牺牲激活参数量、不降低注意力容量的条件下实现的。

阶跃星辰宣布联合近 10 家芯片及基础设施厂商，共同发起“模芯生态创新联盟”，首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前，华为昇腾芯片已首先实现 Step 3 的搭载和运行。沐曦、天数智芯和燧原等也已初步实现运行 Step 3。其它联盟厂商的适配工作正在开展。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签