在2025世界人工智能大会上,华为首次线下展出了其最新的昇腾384超节点(Atlas 900 A3 SuperPoD)。该产品基于创新的超节点架构,通过总线技术实现了384个NPU之间的高带宽、低时延互联,有效解决了集群通信瓶颈。华为昇腾超节点凭借超大带宽、超低时延和超强性能,能够满足大规模AI模型训练和推理对低时延、大带宽、长稳可靠的严苛需求。华为的CloudMatrix 384解决方案,基于384颗昇腾芯片,算力接近英伟达GB200 NVL72系统的两倍,并在内存容量和带宽方面拥有显著优势,被国外投行认为在AI基础设施方面领先市场一代,对全球AI产业格局将产生深远影响。
🚀 **昇腾384超节点:突破性架构实现高效互联。** 华为展出的Atlas 900 A3 SuperPoD,集成了384个NPU,通过先进的总线技术实现了超高带宽、超低时延的互联,解决了传统集群通信瓶颈,让大规模NPU协同工作如同单一计算机般稳定高效。这一创新架构在今年5月的开发者大会上已成功实现业界最大规模的384卡高速总线互联,标志着华为在AI硬件互联技术上的重大突破。
💡 **三大优势满足严苛AI需求。** 昇腾超节点具备超大带宽、超低时延、超强性能三大核心优势,专为满足模型训练和推理对低时延、大带宽、长稳可靠性的严苛要求而设计。这使得它在处理复杂的AI任务时,能够提供更稳定、更高效的性能表现,为AI应用的深度发展奠定坚实基础。
📊 **CloudMatrix 384:算力与内存的飞跃。** 华为的CloudMatrix 384解决方案,以384颗昇腾芯片为核心,采用全互连拓扑架构,提供高达300 PFLOPs的BF16算力,性能上远超竞争对手。在内存容量和带宽方面,CM384更是实现了对英伟达方案的显著超越,内存容量超出3.6倍,内存带宽达到2.1倍,为大规模AI训练和推理提供了强有力的硬件支撑。
🌍 **规模化解决方案引领AI新格局。** 尽管单颗昇腾芯片性能不及英伟达,但华为通过创新的规模化系统设计,成功实现了整体算力的巨大提升,并在超大规模模型训练和实时推理等场景中展现出强大的竞争力。国外投行认为华为的AI基础设施解决方案领先市场一代,预示着中国在AI算力领域的突破将深刻影响全球AI产业的发展方向。
快科技7月26日消息,今日,2025世界人工智能大会(WAIC)在上海世博中心盛大举行。在此次大会上,华为首次线下展出了昇腾384超节点,其正式名称为Atlas 900 A3 SuperPoD。


这款产品基于超节点架构打造,通过总线技术达成了384个NPU之间的大带宽低时延互联,有效解决了集群内计算、存储等各资源之间的通信瓶颈问题。
同时,借助系统工程的优化,实现了资源的高效调度,让超节点能够像一台计算机一样稳定工作。


其实,在今年5月的鲲鹏昇腾开发者大会上,华为就已推出了昇腾超节点,成功实现了业界最大规模的384卡高速总线互联。
昇腾超节点具备超大带宽、超低时延、超强性能三大显著优势,涵盖多款训练和推理产品。
基于超节点创新架构,它能更好地满足模型训练和推理对低时延、大带宽、长稳可靠的严苛要求。
据官方公告,华为的AI算力集群解决方案CloudMatrix 384,以384颗昇腾芯片为基础构建,通过全互连拓扑架构实现芯片间的高效协同。
该方案可提供高达300 PFLOPs的密集BF16算力,性能接近英伟达GB200 NVL72系统的两倍。


此外,CM384在内存容量和带宽方面同样优势明显,其总内存容量超出英伟达方案3.6倍,内存带宽达到英伟达方案的2.1倍,为大规模AI训练和推理提供了更为高效的硬件支持。

尽管单颗昇腾芯片的性能约为英伟达Blackwell架构GPU的三分之一,但华为通过规模化系统设计,成功实现了整体算力的显著跃升,并在超大规模模型训练、实时推理等场景中展现出更强的竞争力。
按照国外投行的观点,华为的规模化解决方案“领先于英伟达和AMD目前市场上的产品一代”,并且认为中国在AI基础设施上取得的突破,将对全球AI产业格局产生深远影响。