算力百科 07月13日 07:28
拨乱反正,华为正重构昇腾AI芯片,将由ASIC转向GPGPU;或命名GPNPU,兼具 GPU 和 ASIC 优点!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章探讨了华为在AI芯片领域的战略转型。面对中国AI算力需求增长和技术封锁,华为正从专注于ASIC芯片,转向构建与GPGPU生态兼容的软件环境,旨在支持中国大模型训练。文章分析了ASIC在推理领域的优势和GPGPU在训练领域的关键作用,强调了兼容NVIDIA CUDA生态的重要性,并阐述了华为“硬件+GPGPU生态”的双轮驱动策略,以及其面临的挑战和机遇。

💡 华为的AI芯片战略正在从专注于ASIC的极致效率,转向构建与GPGPU生态兼容的软件环境,特别关注与NVIDIA CUDA的兼容性,以适应大模型训练需求。

⚙️ GPGPU凭借其强大的并行计算能力和高度的编程灵活性,能够更好地适应“通用”的、探索性的训练需求,而ASIC芯片在特定和边缘场景的AI推理领域具有能效优势。

🌉 为了赢得市场,华为致力于开发中间件和翻译层技术,实现CUDA生态的无缝移植,构建类GPGPU的软件接口,从而复制GPGPU的生态优势。

🎯 华为在AI芯片布局上采取“两条腿走路”策略:在云端训练侧,通过构建软件生态兼容GPGPU,积极抢占大模型市场;在端侧和边缘推理侧,则继续深耕其DaVinci架构的ASIC核心。

⚠️ 华为面临的挑战包括技术难度高、生态信任度建立和持续追赶NVIDIA的压力。但通过兼容CUDA,华为有望在技术管制下,走出一条自主创新之路。

原创 算力百科 J 2025-07-13 06:00 贵州

老华为算力人都知道,华为内部发生过AI芯片ASIC与GPU两条技术路线之争,当时asic赢了才有了后续910 系列,现在也算是拨乱反正!也许最后的 AI芯片不叫 GPGPU,叫 GPNPU,更合适,兼具 GPU 和 ASIC 特性。

       老华为算力人都知道,华为内部发生过AI芯片ASIC与GPU两条技术路线之争,当时ASIC赢了,才有了今天的910 系列,现在也算是拨乱反正!

       事实1.英伟达在卖 GPU,组建了超过千人的 ASIC 研发团队;

       事实2.华为在卖 ASIC,组建了GPGPU研发团队;

    也许最后的AI芯片不叫 GPGPU,叫GPNPU,兼具 GPU 和 ASIC 优势特性。

     在中国AI算力需求井喷与外部技术封锁加剧的双重背景下,华为昇腾(Ascend)系列AI芯片正悄然进行一场深刻的战略变革。这场变革并非简单的硬件架构迭代,而是从过去专注于ASIC(专用集成电路)的极致效率,转向一种更宏大、更艰难的路线——在保持ASIC硬件优势的同时,全面构建与GPGPU(通用图形处理器)生态,特别是NVIDIA CUDA,相兼容的软件与应用环境。

    这标志着华为的AI芯片战略,正从“单点优化”走向“生态构建”,旨在真正撑起中国大模型训练任务的半边天。

GPGPU训练共识:无缝移植CUDA生态是成败关键

    随着大语言模型的参数和复杂性呈指数级增长,业界已形成广泛共识:GPGPU,尤其是NVIDIA的GPU,是目前AI训练的最佳架构。

    ASIC芯片为特定算法和任务(如早期的CNN网络)设计,能够实现极高的能效比,但在模型结构快速迭代的今天,其“专用”特性反而成为桎梏。大模型的训练不仅涉及海量的矩阵运算,还需要处理复杂的控制流、自定义算子和不断演进的网络结构。

    GPGPU凭借其强大的并行计算能力和高度的编程灵活性,能够更好地适应这种“通用”的、探索性的训练需求。至今,全球范围内尚未出现一款在通用大模型训练领域取得巨大商业成功的ASIC芯片。

    对于肩负着国产算力重任的华为而言,这一趋势尤为关键。中国成千上万的AI开发者和研究机构,其技术栈、开发习惯和算法模型都深度绑定于NVIDIA的CUDA生态。CUDA不仅是一个编程模型,更是一个包含了cuDNN、TensorRT、NCCL等无数优化库、开发工具和第三方软件的庞大帝国。

    华为AI芯片若想赢得市场,单纯在浮点运算(FLOPS)指标上追赶甚至超越NVIDIA的某款芯片已远远不够。特性支持已不是最重要的考量,核心在于能否实现对CUDA生态的无缝移植。 开发者不愿意,也没有足够的时间和成本,为一套全新的、不成熟的硬件和软件栈重写所有代码。

    正是在这一背景下,华为的战略转向变得势在必行。最新的信息显示,华为正致力于开发中间件和翻译层技术,旨在让习惯于CUDA编程的开发者能够以最小的改动,甚至无需改动,就将现有模型和应用迁移到昇腾硬件上。这一举措,实质上是在昇腾的ASIC(严格来说是NPU,一种专为神经网络设计的ASIC)之上,构建一个“类GPGPU”的软件接口,其雄心在于复制GPGPU的生态优势。

ASIC推理共识:专用场景效率为王    与训练领域的挑战形成鲜明对比,ASIC在AI推理(Inference)领域,尤其是特定和边缘场景,其王者地位无可争议。

    推理任务的特点是模型相对固定,任务单一,且对功耗、成本和延迟极为敏感。在这些场景下,GPGPU的“通用性”反而成为一种资源浪费。ASIC芯片可以针对固化的模型(如人脸识别、语音唤醒、目标检测等)进行深度优化,去除所有不必要的逻辑单元,将芯片的每一寸硅晶都用于最高效的计算。

ASIC在推理应用中展现出无与伦比的优势:

    华为在AI芯片的布局上呈现出清晰的“两条腿走路”策略:(只有巨头才有实力走两条腿)

    在云端训练侧,通过构建软件生态兼容GPGPU,积极抢占大模型市场;

    在端侧和边缘推理侧,则继续深耕其DaVinci架构的ASIC核心,巩固在自动驾驶、消费电子等领域的固有优势。

CUDA生态为王:兼容是生存之道,超越是最终目标

    当前,大模型的技术范式仍处在剧烈的变革之中,没有哪一种模型或算法可以被认为是终局。在这种高度不确定的技术环境中,生态的通用性和健壮性,成为了比单点硬件性能更重要的“护城河”。

    NVIDIA正是凭借其提前近二十年布局的CUDA生态,锁定了全球AI开发者的“肌肉记忆”。据统计,超过90%的开源AI项目都基于CUDA开发,全球拥有数百万CUDA开发者。这种强大的网络效应,使得任何试图另起炉灶的硬件厂商都面临着几乎不可逾越的壁垒。客户在选择AI芯片时,首要考量的往往是“是否兼容我现有的软件栈”,而非单纯的硬件参数对比。

    对于华为而言,这是一场不得不打的“生态战”。其自研的CANN(异构计算架构)和MindSpore深度学习框架,虽然在技术上不断追赶,但在生态成熟度、文档完备性和开发者社区规模上,与CUDA相比仍有巨大差距。    这也是为什么华为近期的策略核心转向“兼容CUDA”的原因。通过提供高效的CUDA到CANN的翻译工具,华为试图搭建一座桥梁,将CUDA帝国的一部分“流量”引导至自己的昇腾硬件之上。

这条路充满挑战:

    技术难度高: CUDA作为一个庞大而复杂的系统,完美的j和性能对齐极其困难,初期可能面临性能损失和稳定性问题。

    生态信任度: 开发者需要时间来验证华为兼容方案的可靠性和易用性,这需要华为投入巨大的工程资源进行支持和优化。

    持续追赶的压力: NVIDIA仍在高速迭代其硬件和CUDA版本,华为的兼容层需要不断更新,以跟上对手的步伐。

    这也是华为唯一的破局之路。在美国的技术管制下,中国市场无法获得最先进的NVIDIA GPU,这为华为昇腾创造了一个宝贵的市场窗口。

    通过“硬件(ASIC)+GPGPU(类CUDA生态)”的双轮驱动,华为正试图在被动局面下,走出一条独特的自主创新之路。

    华为AI芯片的战略,并非是要放弃其在ASIC领域积累的核心优势,转而从零开始研发GPGPU。

    更准确地说,它是在深刻洞察了“训练看生态,推理看能效”的行业规律后,做出的一项务实而宏大的战略抉择:以ASIC的硬件为基石,向上全力构建一个足以媲美甚至兼容GPGPU的软件生态。 

    这场艰难的“转向”,将直接决定华为能否在未来的AI浪潮中,真正成为中国乃至全球算力格局中举足轻重的一极。

    如果你要做算力中心 ,ASIC 和 GPGPU 选择要根据实际情况,不一定谁比谁更好!别带节奏!,没有说 GPU 一定比 ASIC 更好,反之亦然;

    已经选择了的也别心里不平衡,既成事实,就踏实做好后续运营...

全国首个算力和大模型工程专属服务IP

        算力百科,承接独立咨询项目,以实战经验帮助甲方避坑,收费标准公开/透明:(50000+500*建设P数)/年/项,项目签约服务期限12个月,任何问题可咨询。

经验擅长:

1.设备选型:帮助甲方选择合适的AI卡和设备,组网、存储技术方案评审,避免“设备开机即淘汰”的尴尬局面;

2.转型咨询:IPO或者实体公司算力转型咨询,帮助转型的公司避免 “算力陷阱”和“合同陷阱”等;帮助搭建算力"研发-建设-运维-运营"的自有团队;

3.绿算咨询:协助甲方咨询和规划绿电和算力之间平衡,造价评估和商业模式设计,避免入坑;

价评议价格合理性,避免甲方被“割韭菜”;

算力宝典,第一章、算力中心从入门到精通【概述篇】

算力宝典,第二章 算力中心从入门到精通【模式篇】

算力宝典,第三章、算力中心从入门到精通【方案篇】

算力宝典 第四章、算力中心从入门到精通【公式篇】

算力宝典 第五章《算力中心从入门到精通【运营篇】

以上产品来自签约合作供应商,

欢迎质优价廉国产AI卡供应商洽谈!

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

华为 AI芯片 ASIC GPGPU CUDA
相关文章