36kr-科技 2024年07月24日
PC的“超大核显”时代,我们是否已做好准备
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

AMD即将推出的Strix Halo APU,拥有强大的16核Zen5 CPU和高达70 TOPs的NPU,最引人注目的是其集成40CU RDNA3.5核显,性能甚至可以媲美桌面版RTX4070 Super。Strix Halo还将采用256bit统一内存设计,提供高达256GB的内存容量,旨在为移动生成式AI工作站提供强劲的性能支持。

🤔 **强大的硬件规格:** Strix Halo APU拥有16核Zen5 CPU、高达70 TOPs的NPU,以及40CU RDNA3.5核显,性能堪比桌面级显卡。其40CU核显拥有2560个流处理器、160个纹理单元和80个光栅单元,单精度算力可达29.7 TFlops,甚至可以媲美RTX4090 Max-Q版本。 Strix Halo还配备了32MB的四级缓存,以及高达256GB的LPDDR5X内存,提供240GB/s的内存带宽,旨在减轻CPU和GPU之间的内存带宽争夺,为AI工作站提供强大的性能支持。

🧐 **独特的定位:** Strix Halo的目标市场是移动生成式AI工作站,其高TDP设计(120W以上)和高内存配置,旨在提供强大的性能和长时间续航能力,满足AI创作任务的需求。与传统CPU+独显方案相比,Strix Halo的单芯片设计可以实现更轻薄的机身,并提供更高的能效。 此外,Strix Halo的AI工作站定位使其与传统的独显游戏本没有直接竞争关系,其强大的性能和独特的内存设计,使其在AI创作领域具有独特的竞争优势。

🚀 **潜在的行业影响:** Strix Halo的推出,或将引领PC芯片向集成化方向发展,并推动统一内存设计在x86架构产品中的应用。虽然目前还不能确定Strix Halo是否会成为主流,但其强大的性能和独特的定位,无疑会为PC芯片市场带来新的活力,并为未来AI工作站的发展提供新的可能性。 值得注意的是,苹果M系芯片和高通骁龙X系列等芯片,已经为Strix Halo的成功奠定了基础,为开发者提供了针对“大U大显”芯片进行优化的经验,也为未来PC芯片的发展提供了新的思路。

不久前,在我们三易生活在分析AMD技术日所公布的产品信息时就曾经指出,AMD在最新的GPU和NPU设计里,似乎还埋了一些“伏笔”。

当时我们所指的信息,主要有两个方面。其一是AMD大篇幅地宣传XDNA2在他们AI体系中的作用,但绝口未提如今RDNA3独显里所集成的AI单元设计。这可能是在暗示他们将在未来的消费级显卡里也全面集成XDNA单元作为AI加速器,而不再使用现有的、由显卡团队设计的AI单元。(当然这也可能意味着,对现有显卡AI单元的潜力挖掘和功能适配工作会受到影响)。

其二就是我们注意到,AMD方面在介绍RDNA3.5核显的变化时,专门讲到它提升了内存效率,降低了GPU对于内存带宽的依赖度。而这似乎便是在暗示那已传闻许久,PC史上第二款x86架构的“超大核显”设计Strix Halo APU。

16核CPU+超大NPU,还有比独显更强的核显

Stirx Halo有多强?就在前不久,多款基于这款处理器的测试平台信息被曝光。根据这些信息可以推测,一款典型的Stirx Halo拥有两个8核心Zen5 CPU模块、最高主频5.8GHz,并集成了高达64MB的三级缓存。与此同时,它还拥有算力达到70TOPs级别的NPU。

当然,Stirx Halo最引人注目的地方还是在于,它还拥有一颗堪称恐怖的40CU RDNA3.5核显。稍作计算就会发现,这意味着这颗GPU具备2560个流处理器、160个纹理单元、80个光栅单元,以及40个光追单元。换句话说,它的硬件规模甚至超过了现在的Radeon RX7700S独显。

更进一步来说,如果假设Stirx Halo的核显运行频率与它的同代次“小弟”、也就是Radeon 890M相仿,那么这颗40CU的巨大核显将会拥有恐怖的29.7TFlops单精度算力,以及232GP/s的像素填充率和348GT/s的纹理填充率。

这是什么概念呢?如果只比较单精度算力的话,Stirx Halo甚至已经可以比肩隔壁RTX4090的Max-Q版本,或者说与桌面版的RTX4070 Super差不多了。

大CPU大GPU的内存抢占问题,注定不容忽视

当然,以往的经验告诉我们,看起来很高的硬件规格并不总是意味着实际很好的性能表现。特别是对于CPU和GPU集成在一起的芯片来说,当两者的规格都很“大”的时候,相互之间的内存带宽抢占可能就会变成一个不容忽视的问题。

当然,AMD方面不可能没有想到这个问题。按照目前流传的说法,Stirx Halo将会拥有32MB、由CPU和GPU共用的四级缓存,以减轻对内存带宽的压力。

更为重要的是,Stirx Halo很可能会是x86架构移动处理器中首个使用256bit统一内存的设计。据目前已曝光的测试平台来看,它的内存容量或将从32GB起步,最高提供128GB、甚至256GB可选。

假设Strix Halo的CPU内存控制器体质与目前已经发布的锐龙AI移动平台相仿,那么这就意味着它将支持256bit的LPDDR5X内存、从而提供240GB/s的内存带宽。

乍看之下,这个内存带宽似乎已经非常大,甚至比线程撕裂者7000X系列的内存带宽还要高了近50%。但如果考虑到GPU的显存池带宽需求,那么它实际上可能只能算是“勉强够用”。因为类比就会发现,桌面端比它流处理器数量少20%的Radeon RX7600,其所标配的显存带宽都已高达288GB/s,而且这还是真正的独立显存,并不需要与CPU共享带宽。

特殊的产品定位,或是Strix Halo的破局之道

那么这是否意味着Strix Halo的“超大核显”,性能就会不尽如人意呢?其实也不见得。

高TDP的单芯片PC方案有没有觉得很眼熟?其实当年Intel也做过类似的产品

从目前的已知信息来看,Strix Halo这颗“超级APU”的产品定位会非常、非常高。据称其单芯片TDP高达120W以上,而且会标配超大内存,主打的就是“移动生成式AI工作站”。

DELL曾基于Intel KabyLake-G平台推出了翻转屏笔记本工作站

于是在这样的产品定位下,一方面只要Strix Halo的单芯片功耗低于常规的标压CPU+移动独显方案,那么它反而有望实现一些大尺寸、但非常轻薄的笔记本工作站产品形态,而且带来比潜在的独显竞品更长的续航能力。

一款出厂搭配5600MHz内存的12代酷睿轻薄本,证明高价产品的确可能会有额外的性能设计

从另一方面来说,考虑到Stirx Halo的定位,显然也不能排除AMD(或相关PC厂商)届时为其搭配更高频率内存颗粒,从而额外增加内存带宽的可能性,毕竟类似的情况我们三易生活就已经见识过。可以说只要产品定位够高、定价够贵,厂商就确实会有动机去额外“加料”,当然反之亦然。

最后、也是最重要的,就是虽然当Strix Halo真正登场时,它可能会是x86架构里唯一在售,采用“超大核显”、以及大带宽统一内存设计的PC工作站芯片方案。但纵观整个业界,无论苹果的M系芯片、还是高通的骁龙X系列,实际上都相当于已经替它开辟了道路,至少让相关开发者在面对这种“大U大显”的特殊PC芯片做优化时,并不太可能会无所适从。

况且如果Stirx Halo明确定位于“AI工作站芯片”,那么这也就意味着,它并不见得会与那些独显游戏本构成直接竞争。再考虑到AI创作任务对于GPU显存的特殊需求(容量远比带宽重要),以及届时业内可能比现在更成熟的应用优化环境,这款看起来非常梦幻的超大型APU芯片,届时确实可能会有其独特的市场竞争力。

至于说它的诞生是否会引领PC芯片更大规模地转向“集成化”,甚至于让统一内存的理念也浸染更多x86架构产品,目前可能还不太好说。

本文来自微信公众号“三易生活”,作者:三易菌,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AMD Strix Halo APU 超大核显 统一内存 AI工作站 PC芯片 移动生成式AI
相关文章