PC的“超大核显”时代，我们是否已做好准备

不久前，在我们三易生活在分析AMD技术日所公布的产品信息时就曾经指出，AMD在最新的GPU和NPU设计里，似乎还埋了一些“伏笔”。

当时我们所指的信息，主要有两个方面。其一是AMD大篇幅地宣传XDNA2在他们AI体系中的作用，但绝口未提如今RDNA3独显里所集成的AI单元设计。这可能是在暗示他们将在未来的消费级显卡里也全面集成XDNA单元作为AI加速器，而不再使用现有的、由显卡团队设计的AI单元。（当然这也可能意味着，对现有显卡AI单元的潜力挖掘和功能适配工作会受到影响）。

其二就是我们注意到，AMD方面在介绍RDNA3.5核显的变化时，专门讲到它提升了内存效率，降低了GPU对于内存带宽的依赖度。而这似乎便是在暗示那已传闻许久，PC史上第二款x86架构的“超大核显”设计Strix Halo APU。

16核CPU+超大NPU，还有比独显更强的核显

Stirx Halo有多强？就在前不久，多款基于这款处理器的测试平台信息被曝光。根据这些信息可以推测，一款典型的Stirx Halo拥有两个8核心Zen5 CPU模块、最高主频5.8GHz，并集成了高达64MB的三级缓存。与此同时，它还拥有算力达到70TOPs级别的NPU。

当然，Stirx Halo最引人注目的地方还是在于，它还拥有一颗堪称恐怖的40CU RDNA3.5核显。稍作计算就会发现，这意味着这颗GPU具备2560个流处理器、160个纹理单元、80个光栅单元，以及40个光追单元。换句话说，它的硬件规模甚至超过了现在的Radeon RX7700S独显。

更进一步来说，如果假设Stirx Halo的核显运行频率与它的同代次“小弟”、也就是Radeon 890M相仿，那么这颗40CU的巨大核显将会拥有恐怖的29.7TFlops单精度算力，以及232GP/s的像素填充率和348GT/s的纹理填充率。

这是什么概念呢？如果只比较单精度算力的话，Stirx Halo甚至已经可以比肩隔壁RTX4090的Max-Q版本，或者说与桌面版的RTX4070 Super差不多了。

大CPU大GPU的内存抢占问题，注定不容忽视

当然，以往的经验告诉我们，看起来很高的硬件规格并不总是意味着实际很好的性能表现。特别是对于CPU和GPU集成在一起的芯片来说，当两者的规格都很“大”的时候，相互之间的内存带宽抢占可能就会变成一个不容忽视的问题。

当然，AMD方面不可能没有想到这个问题。按照目前流传的说法，Stirx Halo将会拥有32MB、由CPU和GPU共用的四级缓存，以减轻对内存带宽的压力。

更为重要的是，Stirx Halo很可能会是x86架构移动处理器中首个使用256bit统一内存的设计。据目前已曝光的测试平台来看，它的内存容量或将从32GB起步，最高提供128GB、甚至256GB可选。

假设Strix Halo的CPU内存控制器体质与目前已经发布的锐龙AI移动平台相仿，那么这就意味着它将支持256bit的LPDDR5X内存、从而提供240GB/s的内存带宽。

乍看之下，这个内存带宽似乎已经非常大，甚至比线程撕裂者7000X系列的内存带宽还要高了近50%。但如果考虑到GPU的显存池带宽需求，那么它实际上可能只能算是“勉强够用”。因为类比就会发现，桌面端比它流处理器数量少20%的Radeon RX7600，其所标配的显存带宽都已高达288GB/s，而且这还是真正的独立显存，并不需要与CPU共享带宽。

特殊的产品定位，或是Strix Halo的破局之道

那么这是否意味着Strix Halo的“超大核显”，性能就会不尽如人意呢？其实也不见得。

高TDP的单芯片PC方案有没有觉得很眼熟？其实当年Intel也做过类似的产品

从目前的已知信息来看，Strix Halo这颗“超级APU”的产品定位会非常、非常高。据称其单芯片TDP高达120W以上，而且会标配超大内存，主打的就是“移动生成式AI工作站”。

DELL曾基于Intel KabyLake-G平台推出了翻转屏笔记本工作站

于是在这样的产品定位下，一方面只要Strix Halo的单芯片功耗低于常规的标压CPU+移动独显方案，那么它反而有望实现一些大尺寸、但非常轻薄的笔记本工作站产品形态，而且带来比潜在的独显竞品更长的续航能力。

一款出厂搭配5600MHz内存的12代酷睿轻薄本，证明高价产品的确可能会有额外的性能设计

从另一方面来说，考虑到Stirx Halo的定位，显然也不能排除AMD（或相关PC厂商）届时为其搭配更高频率内存颗粒，从而额外增加内存带宽的可能性，毕竟类似的情况我们三易生活就已经见识过。可以说只要产品定位够高、定价够贵，厂商就确实会有动机去额外“加料”，当然反之亦然。

最后、也是最重要的，就是虽然当Strix Halo真正登场时，它可能会是x86架构里唯一在售，采用“超大核显”、以及大带宽统一内存设计的PC工作站芯片方案。但纵观整个业界，无论苹果的M系芯片、还是高通的骁龙X系列，实际上都相当于已经替它开辟了道路，至少让相关开发者在面对这种“大U大显”的特殊PC芯片做优化时，并不太可能会无所适从。

况且如果Stirx Halo明确定位于“AI工作站芯片”，那么这也就意味着，它并不见得会与那些独显游戏本构成直接竞争。再考虑到AI创作任务对于GPU显存的特殊需求（容量远比带宽重要），以及届时业内可能比现在更成熟的应用优化环境，这款看起来非常梦幻的超大型APU芯片，届时确实可能会有其独特的市场竞争力。

至于说它的诞生是否会引领PC芯片更大规模地转向“集成化”，甚至于让统一内存的理念也浸染更多x86架构产品，目前可能还不太好说。

本文来自微信公众号“三易生活”，作者：三易菌，36氪经授权发布。

16核CPU+超大NPU，还有比独显更强的核显

大CPU大GPU的内存抢占问题，注定不容忽视

特殊的产品定位，或是Strix Halo的破局之道

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签