华为在华为云生态大会2025上发布了CloudMatrix 384超节点,标志着其在AI基础设施领域的最新进展。该超节点在芜湖数据中心规模上线,通过架构创新,实现了算力、互联带宽、内存带宽等多方面的领先。华为云持续优化昇腾 AI 云服务,全面适配160多个第三方大模型,并推动盘古大模型在多个行业的应用。此外,硅基流动联合华为云,基于CloudMatrix 384超节点昇腾云服务和SiliconLLM框架,上线DeepSeek-R1,性能表现出色,为大模型训推提供有力支持。
🚀 **CloudMatrix 384超节点:** 华为云推出的新一代AI基础设施,实现了从服务器级到矩阵级的资源供给模式转变,具备“高密”“高速”“高效”的特点。该超节点已在芜湖数据中心规模上线,通过架构创新,在算力、互联带宽、内存带宽等方面实现领先。
💡 **昇腾AI云服务优化:** 华为云持续优化昇腾AI云服务,目前已全面适配包含DeepSeek在内的160多个第三方大模型。这为大模型训推提供了可靠保障,有助于行业应用的快速落地。
🌐 **盘古大模型应用:** 华为云盘古大模型已在30多个行业、400多个场景中落地,应用领域涵盖城市治理、智慧金融、医疗健康、气象预测等,展现了其广泛的应用前景。
🤝 **硅基流动合作:** 硅基流动联合华为云,基于CloudMatrix 384超节点昇腾云服务和高性能推理框架SiliconLLM,正式上线DeepSeek-R1。该服务在保证单用户20 TPS水平前提下,单卡Decode吞吐突破1920 Tokens/s,性能表现出色。
IT之家 4 月 10 日消息,在今日举行的华为云生态大会 2025 上,华为常务董事、华为云计算 CEO 张平安公布了 AI 基础设施架构进展,推出 CloudMatrix 384 超节点,并宣布已在芜湖数据中心规模上线。

据介绍,华为云 CloudMatrix 384 超节点可实现从服务器级到矩阵级的资源供给模式转变,具备“高密”“高速”“高效”的特点,通过架构创新,在算力、互联带宽、内存带宽等方面实现领先。
华为云还表示,对昇腾 AI 云服务进行持续优化,目前其已全面适配包含 DeepSeek 在内的 160 多个第三方大模型,为大模型训推提供可靠保障,支撑行业应用快速落地。此外,华为云盘古大模型已在 30 多个行业、400 多个场景中落地,在城市治理、智慧金融、医疗健康、气象预测等领域广泛应用。

IT之家注意到,硅基流动今日也宣布联合华为云基于 CloudMatrix 384 超节点昇腾云服务和高性能推理框架 SiliconLLM ,用大规模专家并行最佳实践正式上线 DeepSeek-R1。
硅基流动介绍称,该服务在保证单用户 20 TPS 水平前提下,单卡 Decode 吞吐突破 1920 Tokens / s,可比肩 H100 部署性能。同时,经过主流测试集验证及大规模线上盲测,在昇腾算力部署 DeepSeek-R1 的模型精度与 DeepSeek 官方保持一致。