原创 算力百科 J 2025-05-12 06:00 北京
万能充很牛,被充电宝取代是技术发展的必然; 汽油车很牛,被新能源车取代是技术发展必然; PCIE很牛,被C2C取代也是技术发展的必然; CPU很牛,被AISOC取代也是技术发展的必然。
万能充很牛,被充电宝取代是场景发展的必然;
油车很牛,被新能源车取代是场景发展必然;
PCIE很牛,被C2C取代是场景发展的必然;
CPU很牛,被AISOC取代也是场景发展的必然。
目前,这里买个主板,那里买个AI卡,组装成AI服务器的业务最终会消亡,这类从业者也会消失!万能充、油车、PCIE、CPU被淘汰,不是因为他们自身不够优秀,只是因为业务在快速发展,有了更优秀的替代品...
10年前没几个人会认为自己会买家用新能源车,有些产业布局,需要布局10年之久,才会落地,但是场景发展趋势不可逆...
有些技术没有场景一文不值,有些场景,需要新技术去满足...
在过去的十年里,人工智能(AI)的软件层面经历了爆炸式的增长和革新,算法模型的复杂度和应用场景的广度都达到了前所未有的高度。然而,与之形成对比的是,AI硬件的形态演进相对平缓。
展望未来十年,我们将迎来AI硬件发展的黄金加速期,这也是AI产业链深度整合与重塑的关键阶段。在这一变革浪潮中,Chip-to-Chip(C2C)互联技术取代传统的PCIe卡,将成为AI算力硬件发展的必然选择。
AI硬件的发展正呈现出三大显著趋势,共同指向一个更高效率、更集成化、更场景化的未来。
C2C取代PCIe:PCIE阻碍了AI硬件创新
PCIe(Peripheral Component Interconnect Express)作为一种通用的总线标准,在过去的计算机体系结构中扮演了重要角色,它为不同厂商的组件提供了互操作性,促进了生态的繁荣。然而,PCIe联盟的决策机制和标准制定周期,使其在面对AI应用对带宽、延迟和功耗提出的极致要求时,显得力不从心,迭代速度难以匹配AI芯片的飞速发展。
AI模型,特别是多模态模型,对芯片间的通信带宽和延迟要求极为苛刻。传统的PCIe在带宽增长、物理连接器尺寸以及信号完整性方面逐渐暴露出瓶颈。
相比之下,Chip-to-Chip(C2C)或更广义的die-to-die互联技术,通过更短的物理距离、更优化的信号路径以及专为高速互联设计的协议,能够提供远超PCIe的带宽密度、更低的延迟和更优的能效比。随着多芯片封装(MCM)、Chiplet等技术的成熟,C2C使得不同功能、不同工艺的裸片(die)能够高效集成,实现更灵活、更快速的产品迭代。
这种高效、敏捷的特性,使其成为AI加速器、高性能计算集群内部互联的主流选择,并逐步取代PCIe在AI算力节点中的主导地位,是AI硬件走向极致性能的必然趋势。
AI SoC整合是算力革命的重要一步
AI算力通常依赖于CPU与专门的AI芯片(如GPU、ASIC)协同工作。然而,这种分离式设计在数据搬运、任务调度和整体能效方面存在固有开销。
未来的趋势是走向高度集成的AI SoC(System on Chip)。这种AI SoC将不再是独立的CPU公司和独立的AI芯片公司的产品简单组合,而是将通用计算核心(如CPU)、AI加速核心以及其他必要的功能单元(如内存控制器、网络接口)统一设计、统一制造在一颗芯片上。
通过这种深度集成,配合先进的软件调度系统,可以实现对芯片内部不同算力形态的灵活调配和高效利用。无论是需要通用计算能力的“通算”任务,还是针对AI推理和训练的“智算”任务,甚至是更高阶的“超算”需求,都可以在一颗AI SoC内部得到统一的资源视图和智能化的调度执行。这将极大提升系统性能,降低功耗,并简化硬件架构。
独立的CPU公司和AI芯片公司若不能适应这一趋势,其生存空间将面临巨大挑战。所以做AI芯片的会自己做自己的CPU,做CPU的一定也会做AI芯片,最后统一到AISoC内封装,成为未来主流形态...
AI硬件一体成型:封装技术的集约化革命
AISOC芯片3D封装技术(如CoWoS, InFO, EMIB等)的不断成熟和成本优化,AI硬件的形态正朝着“AISOC一体成型”的方向发展。
这意味着,未来AI硬件将更加集约化、小型化和高密化。
在芯片级封装内部,集成的裸片(die)数量会越来越多,这些裸片可能包含计算单元、存储单元、I/O单元等。
通过先进封装技术,可以将原本分布在PCB板卡上的多个分立器件,高度集成到单一aisoc封装体内。这不仅大幅缩减了物理尺寸,降低了系统功耗,更重要的是,它极大地减少了传统硬件板卡设计的复杂度和信号在板级传输的损耗与延迟。这种趋势将推动AI硬件从“板卡组合”向“封装即系统”演进,进一步提升算力密度和能效比。
AI硬件产业格局的重塑
有产业消亡,就会有产业崛起。基于以上三大技术发展趋势——C2C的高效互联、AI SoC的深度整合以及先进封装带来的硬件一体化——AI硬件产业的格局将发生深刻变革。
那些依赖传统PCIe板卡组装、缺乏核心设计能力的AI硬件组装厂,将面临技术迭代带来的巨大压力,其市场份额会逐渐萎缩甚至被淘汰。
与此同时,新的机遇也将涌现。一批更贴近用户场景需求,具备从芯片设计、系统集成到软件优化全栈能力的硬件设计和生产厂家将强势崛起。它们能够根据特定的AI应用(如自动驾驶、智慧医疗、科研计算等)定制化设计高度优化的AI硬件解决方案,提供更高的性能和更低的总体拥有成本(TCO)。
总结而言,以aisoc取代CPU,C2C取代PCIe为代表的技术革新,正引领AI算力硬件进入一个高带宽、低延迟、高集成、场景定制化的新纪元。
高度整合的aisoc让Ai主板开案难度大幅降低,人人都能设计和生产AI服务器主板,区别就是供应链价格管控,带来的成本差异!(这里说的是中低端AI服务器,而且大部分是开源主板方案)
高端AI服务器,nv和hw或者AIsoc厂家会自研高端AI服务器硬件,找类似富士康代工即可!
比如:阿里的ppu AI服务器就是阿里自研之后,找h3c和浪潮代工,代工厂不会获得任何ppu芯片产品相关资料,角色只是个代工厂只负责生产而已,也不允许销售ppu服务器独立出货!
这不仅是技术发展的必然,也将重塑整个AI硬件产业链,为真正满足未来AI应用需求的创新者提供广阔的舞台。作为从业者,我们应积极拥抱这些变化,投身于这场激动人心的硬件革命浪潮之中。
当然技术趋势和技术落地需要一定时间,也许这个周期是3年甚至5年,至少技术趋势是明确的。
所以目前国内没有IPO的Ai服务器整机厂商,宝德(已官宣被并购),超云,国鑫,云尖等需要在未来1-2年内完成被A股公司并购或者独立IPO挂牌,卖给广大股民,留给他们的窗口期不多了,aisoc时代,这类公司技术门槛和价值将大幅降低,失去想象力和资本操作空间...
算力宝典,第一章、算力中心从入门到精通【概述篇】
算力宝典,第二章 算力中心从入门到精通【模式篇】