华为384颗自研芯片方案揭秘领先英伟达AMD一代

Cnbeta 05月02日 17:42

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

美国对华芯片出口的限制引发了业界对中国算力发展的关注。华为推出的AI算力集群解决方案CloudMatrix 384，基于384颗昇腾芯片构建，算力接近英伟达GB200 NVL72系统的两倍。该方案在内存容量和带宽方面也具有显著优势，为大规模AI训练和推理提供了更高效的硬件支持。尽管单颗昇腾芯片性能略逊于英伟达，但华为通过规模化系统设计实现了整体算力的跃升，并在超大规模模型训练、实时推理等场景中展现出更强的竞争力。国外投行认为，华为的解决方案“领先于英伟达和AMD目前市场上的产品一代”，预示着中国在AI基础设施上的突破将对全球AI产业格局产生深远影响。

💻CloudMatrix 384基于384颗昇腾芯片构建，采用全互连拓扑架构，提供高达300 PFLOPs的密集BF16算力，接近英伟达GB200 NVL72系统的两倍。

💾在内存方面，CM384总内存容量超出英伟达方案3.6倍，内存带宽达到2.1倍，为大规模AI训练和推理提供更高效的硬件支持。

💡尽管单颗昇腾芯片性能约为英伟达Blackwell架构GPU的三分之一，但华为通过规模化系统设计，成功实现整体算力跃升，并在超大规模模型训练、实时推理等场景中展现更强竞争力。

🌍国外投行认为，华为的规模化解决方案“领先于英伟达和AMD目前市场上的产品一代”，预示着中国在AI基础设施上的突破将对全球AI产业格局产生深远影响。

美国封锁芯片对华出口，这让英伟达CEO黄仁勋倍感焦虑，因为他深知中国国产算力目前达到了怎样的水平。前段时间华为推出了AI算力集群解决方案CloudMatrix 384，这在外行看来似乎没有什么不同，但如果仔细剖析其影响可谓深远。

按照华为的说法，CloudMatrix 384基于384颗昇腾芯片构建，通过全互连拓扑架构实现芯片间高效协同，可提供高达300 PFLOPs的密集BF16算力，接近达到英伟达GB200 NVL72系统的两倍。

此外，CM384在内存容量和带宽方面同样占据优势，总内存容量超出英伟达方案3.6倍，内存带宽也达到2.1倍，为大规模AI训练和推理提供了更高效的硬件支持。

尽管单颗昇腾芯片性能约为英伟达Blackwell架构GPU的三分之一，但华为通过规模化系统设计，成功实现整体算力跃升，并在超大规模模型训练、实时推理等场景中展现更强竞争力。

按照国外投行的说法，华为的规模化解决方案“领先于英伟达和AMD目前市场上的产品一代”，并认为中国在AI基础设施上的突破将对全球AI产业格局产生深远影响。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签