【配现场组图】华为昇腾384超节点正式亮相强势碾压英伟达、AMD一代

快科技资讯 20小时前

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

在2025世界人工智能大会上，华为首次线下展出了其最新的昇腾384超节点（Atlas 900 A3 SuperPoD）。该产品基于创新的超节点架构，通过总线技术实现了384个NPU之间的高带宽、低时延互联，有效解决了集群通信瓶颈。华为昇腾超节点凭借超大带宽、超低时延和超强性能，能够满足大规模AI模型训练和推理对低时延、大带宽、长稳可靠的严苛需求。华为的CloudMatrix 384解决方案，基于384颗昇腾芯片，算力接近英伟达GB200 NVL72系统的两倍，并在内存容量和带宽方面拥有显著优势，被国外投行认为在AI基础设施方面领先市场一代，对全球AI产业格局将产生深远影响。

🚀 **昇腾384超节点：突破性架构实现高效互联。** 华为展出的Atlas 900 A3 SuperPoD，集成了384个NPU，通过先进的总线技术实现了超高带宽、超低时延的互联，解决了传统集群通信瓶颈，让大规模NPU协同工作如同单一计算机般稳定高效。这一创新架构在今年5月的开发者大会上已成功实现业界最大规模的384卡高速总线互联，标志着华为在AI硬件互联技术上的重大突破。

💡 **三大优势满足严苛AI需求。** 昇腾超节点具备超大带宽、超低时延、超强性能三大核心优势，专为满足模型训练和推理对低时延、大带宽、长稳可靠性的严苛要求而设计。这使得它在处理复杂的AI任务时，能够提供更稳定、更高效的性能表现，为AI应用的深度发展奠定坚实基础。

📊 **CloudMatrix 384：算力与内存的飞跃。** 华为的CloudMatrix 384解决方案，以384颗昇腾芯片为核心，采用全互连拓扑架构，提供高达300 PFLOPs的BF16算力，性能上远超竞争对手。在内存容量和带宽方面，CM384更是实现了对英伟达方案的显著超越，内存容量超出3.6倍，内存带宽达到2.1倍，为大规模AI训练和推理提供了强有力的硬件支撑。

🌍 **规模化解决方案引领AI新格局。** 尽管单颗昇腾芯片性能不及英伟达，但华为通过创新的规模化系统设计，成功实现了整体算力的巨大提升，并在超大规模模型训练和实时推理等场景中展现出强大的竞争力。国外投行认为华为的AI基础设施解决方案领先市场一代，预示着中国在AI算力领域的突破将深刻影响全球AI产业的发展方向。

快科技7月26日消息，今日，2025世界人工智能大会（WAIC）在上海世博中心盛大举行。在此次大会上，华为首次线下展出了昇腾384超节点，其正式名称为Atlas 900 A3 SuperPoD。

这款产品基于超节点架构打造，通过总线技术达成了384个NPU之间的大带宽低时延互联，有效解决了集群内计算、存储等各资源之间的通信瓶颈问题。

同时，借助系统工程的优化，实现了资源的高效调度，让超节点能够像一台计算机一样稳定工作。

其实，在今年5月的鲲鹏昇腾开发者大会上，华为就已推出了昇腾超节点，成功实现了业界最大规模的384卡高速总线互联。

昇腾超节点具备超大带宽、超低时延、超强性能三大显著优势，涵盖多款训练和推理产品。

基于超节点创新架构，它能更好地满足模型训练和推理对低时延、大带宽、长稳可靠的严苛要求。

据官方公告，华为的AI算力集群解决方案CloudMatrix 384，以384颗昇腾芯片为基础构建，通过全互连拓扑架构实现芯片间的高效协同。

该方案可提供高达300 PFLOPs的密集BF16算力，性能接近英伟达GB200 NVL72系统的两倍。

此外，CM384在内存容量和带宽方面同样优势明显，其总内存容量超出英伟达方案3.6倍，内存带宽达到英伟达方案的2.1倍，为大规模AI训练和推理提供了更为高效的硬件支持。

尽管单颗昇腾芯片的性能约为英伟达Blackwell架构GPU的三分之一，但华为通过规模化系统设计，成功实现了整体算力的显著跃升，并在超大规模模型训练、实时推理等场景中展现出更强的竞争力。

按照国外投行的观点，华为的规模化解决方案“领先于英伟达和AMD目前市场上的产品一代”，并且认为中国在AI基础设施上取得的突破，将对全球AI产业格局产生深远影响。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签