雪球今日话题 08月08日 18:04
大话CPO之一:CPO将成唯一选项,为什么?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章深入浅出地探讨了CPO(芯片出光)技术在数据中心互联中的重要性。随着数据传输速率的不断提升,传统的电互连方式面临趋肤效应、介质损耗和电磁干扰等瓶颈,已接近其物理极限。可插拔光模块虽然引入了光通信,但本质上仍是光电混合互联,在高带宽场景下问题依然突出。CPO技术通过将光引擎与芯片进行3D封装,大幅缩短了电信号传输距离,有效克服了电互连的限制,被视为AI算力基础设计架构的范式革命。它不仅能降低功耗和成本,还能提高算力资源的灵活性和可扩展性,是AIDC集群迈向全光网络的必然选择,预示着数据中心互联的未来方向。

⚡️ 电互连的瓶颈:文章指出,在高速率场景下,传统的电互连(铜缆、PCB)因趋肤效应、介质损耗和电磁耦合等问题,已难以满足日益增长的数据传输需求。趋肤效应导致高频信号电阻增大,介质损耗使得信号能量衰减严重,而电磁干扰则破坏信号完整性。这些问题限制了数据传输的效率和可靠性。

💡 可插拔光模块的局限:虽然可插拔光模块是当前数据中心常用的光互联方式,但其本质仍是光电混合互联,即信号需要先通过电信号传输到设备面板,再传递给光模块。这种方式并未根本解决电互连的瓶颈,特别是在800G及以上速率的短距光模块应用中,问题尤为突出。

🌟 CPO技术的革命性:CPO(芯片出光)技术通过先进封装技术,将光引擎与芯片直接集成,大幅缩短了电信号传输距离,从米级缩短到毫米级。这有效解决了电互连面临的难题,实现了“芯片直接出光”,无论传输距离远近,能耗和成本差异极小,从而降低了对光模块和PCB的依赖,是AI算力基础设计架构的范式革命。

🚀 CPO的意义与优势:CPO技术不仅是连接方式的升级,更是对AI算力架构的重塑。它通过“做减法”来降低成本和功耗,例如减少对昂贵铜缆和高密度电路板的需求,降低光模块功耗,简化供电系统。同时,它提高了算力资源的灵活性和可扩展性,使得GPU、存储等资源可以集中管理、按需分配,极大地提升了数据中心的效率和经济性。

6 月 10 日,中国电信原首席科学家韦乐平在公开演讲中一句话直接震动行业:“在高速率场景下,CPO 将成唯一选项”。紧接着,英伟达 CEO 黄仁勋来华,与阿里巴巴 CTO 坐在一起搞了场 CEO 对 CTO 的炉边谈话,当场给在场观众抛了个重磅预言:未来的芯片,会是用 CPO 技术互联起来的、桌面大小的巨型芯片。

AIDC的互联,为什么一定要用CPO(芯片出光)呢?咱们用初中物理里最基础的 “电的特性” 来聊聊这事,保证一听就懂。

电互连(铜缆、PCB):黔驴技穷

1、趋肤效应

当交变电流通过导体时,电流产生变化的磁场,磁场在导体内部激发涡流,抵消中心区域的电流,电流会向导体表面集中,这就是电磁学中的趋肤效应(Skin Effect)。

信号频率越高,趋肤深度越浅。高频信号(100Gbps)在99.999%这种高纯度黄铜表面的爬行深度只有几个微米。

大家都知道,有效导电面积大幅减小,导体的电阻急剧增大。高频信号在趋肤效应下,每往前爬行一步,都需要克服重重阻力。

2、介质损耗

电信号在传输线中传播,可以等效为一小截一小截的电阻串联而成,穿不距离越远,损耗越大。

按照英伟达官方提供的材料,高频信号穿越HDI PCB、连接器等电互联器件,会产生22dB的损耗(对数度量,简化理解为每3dB减少一倍,22dB,信号能量大约减少到只剩下2%左右)。

3、电磁耦合和相互干扰

AIDC 中为提升互连密度,导线(或 PCB 走线)间距不断缩小,但是每一根线的信号频率至少56GHz以上,妥妥的微波信号源。每一根线就是一根微波天线,相邻导线间的电磁耦合会产生严重串扰(Crosstalk),破坏信号完整性。

电互连有三个绕不开的坎:趋肤效应、介质损耗、电磁干扰。解决这些问题的办法:

a)用更贵更好的材料 —— 比如把黄铜纯度提得更高、导线加粗,或者升级电路板的板材质量,成本跟着往上蹿;

b)在芯片里加复杂算法,要么就少传点数据,多留些 “纠错空间”,等于为了准度牺牲速度;

c)搞电中继 —— 每隔一段距离就把信号 “复原放大” 一下再接着传,相当于给信号 “搭个中转站”。

可插拔光模块:光电混合互联,也到头了

翻人类通信史,有个铁规律一直没变:光进铜退 —— 光技术总能慢慢取代铜缆。

二十世纪初,远洋通话全靠海底铜缆,但随着通话需求越来越旺,光纤技术一成熟,海底通信立马换成了光缆,容量和稳定性都翻了倍。到了八十年代,城市里的程控电话系统也跟上节奏,从铜缆逐步转向 SDH 光通信。

进入二十一世纪,家庭宽带兴起时更明显:最早用铜缆电话线上网,带宽撑死 1Mbps,刷个网页都卡;没几年光纤入户普及,直接飙到 1Gbps,看 4K 视频都不卡顿。

现在数据中心里的设备互联,走的还是这条路:当设备间通信带宽超过 10Gbps,距离又在 10 米以上,基本就得靠光互联才能撑住场面。

为了设备更换等便利性,当前的光互联基本都采用可插拔光模块方式,本质上讲,属于光电混合互联 — 先用电互连(PCB走线、铜缆)将信号引到设备的面板,然后在传递给光模块

所以,光模块把通信距离拉远(100米-100公里),但并没有有效解决电互连的三道坎(趋肤效应、介质损耗、电磁干扰),当通信速率达到800G以上时,问题变得相当严重。从目前的情况看,3.2T的短距光模块,没有解决方案

CPO的本质

电互连 —> 光电混合互联 —> 纯光互联(CPO)。

阅读到这里,大家就知道了,CPO是时代的产物,利用半导体先进封装技术,将光引擎与芯片做Chiplet 3D封装,大幅度缩短电信号域的通信距离,从0.5-5米缩短到5mm左右,未来的3D TSV通孔技术加持下,距离进一步缩短到1mm左右

英伟达 CEO 与阿里巴巴 CTO 坐在一起炉边谈话中描述的桌面大小的芯片,就是CPO的一种高级形态,早在2021年,学术界就开始构思:

大家可以把这颗芯片想象成一个工业区,里面有各种各样的厂房,但都通过地下管廊互联在一起(光通信层)。

CPO的意义

CPO 不只是通信连接方式的大升级,更是半导体芯片AI算力基础设计架构的范式革命

在CPO之前,AI算力集群通过反复做加法续命

a)、用越来越贵的铜缆、高密度电路板(HDI PCB),成本跟着往上飙;

b)、光模块功耗越来越大、价格越来越高,电费和设备费都成了负担;

c)、供电系统(HVDC)越做越庞大,占地方又费钱;

d)、各个部件关联越来越紧密,系统想稳定运行变得越来越难,就像机器零件太多,哪都容易出问题。(NVL72、NVL576)

在CPO之后,通过做减法减负

a)、芯片直接出光,不管传输 1 毫米还是 100 米,消耗的能量和成本差不多,不用再为光模块和HDI PCB代代升级而发愁;

b)、算力拆成一个个小单元,不用超大功率的HVDC供电系统,也不用复杂的液冷散热,又省空间又省钱;

c)、GPU、存储(HBM)、交换机这些算力资源像 “水池” 一样集中起来,各自独立,按需建设,扩容起来灵活又方便。

相关标的

CPO先进封装装备龙头 = 罗博特科。

MPO主力参与方:太辰光+仕佳光子。

FAU主力参与方:天孚通信。

CWDFB光源供应商:源杰科技。

CPO微透镜供应商:炬光科技。

AIDC集群通信迈向全光网络,是必然趋势。

全光网络迈向CPO,然后OIO,刻不容缓。

全光网络,大有可为。

$罗博特科(SZ300757)$ $半导体ETF(SH512480)$ $太辰光(SZ300570)$

//利益关联说明:本人的AI算力组合中,有罗博特科和较大比例纳指100ETF,构成利益关联方,本文中所提及的其它代码,发稿前均不持有。

//特别提醒:本文仅为个人学习总结,对未来的趋势预测仅凭个人经验,大家理性辩证参阅,自我投资决策。欢迎任何人前来讨论,但情绪贴先删后黑



本话题在雪球有56条讨论,点击查看。
雪球是一个投资者的社交网络,聪明的投资者都在这里。
点击下载雪球手机客户端 http://xueqiu.com/xz]]>

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

CPO 数据中心 AI算力 光互联 半导体封装
相关文章