快科技资讯 12小时前
AMD Zen5线程撕裂者9000深入揭秘:领先竞品最多145%!四大金刚护卫
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

AMD在Advancing AI 2025大会上发布了基于Zen5架构的锐龙线程撕裂者9000系列处理器,包括针对工作站的PRO 9000WX系列和发烧级桌面的9000系列。文章详细介绍了该系列处理器的架构、技术细节,以及Radeon AI PRO显卡,并展示了四大OEM厂商的新品。锐龙线程撕裂者系列处理器在工作站市场表现出色,Zen5架构带来了性能提升和能效优化,Radeon AI PRO显卡也为专业应用提供了强大的支持。

🚀 **Zen5架构核心升级**:锐龙线程撕裂者9000系列处理器升级至Zen5架构,带来单线程和多线程性能的显著提升。该架构优化了计算负载,引入了512位数据路径AVX-512指令集,并增强了ISA指令能力。内存支持DDR5-6400,PCIe带宽也得到提升。

⚙️ **多核心与缓存优化**:Zen5架构处理器采用chiplets整合封装,最多12个CCD,每CCD最多8核心,最高可达96核心192线程。缓存方面,单核心内一级指令缓存翻倍,一级数据缓存增大至48KB,二级缓存带宽翻倍,三级缓存延迟更低,总缓存可达480MB,这都提升了处理器的整体性能。

💡 **Radeon AI PRO显卡亮相**:AMD推出了Radeon AI PRO显卡,基于RDNA4架构,专为专业工作站设计。该显卡改进了指令处理器和缓存系统,并升级了第二代AI加速器,提升Tensor计算能力。Radeon AI PRO R9700在FP16半精度浮点下峰值性能达到96 TFLOPS,INT4稀疏精度下为1531 TOPS,为AI应用提供了强大的支持。

🤝 **生态系统与OEM支持**:AMD锐龙线程撕裂者系列处理器得到了行业广泛支持,专业软件已进行优化适配。戴尔、惠普、联想、超微等OEM厂商也推出了基于新处理器的产品。联想在AMD工作站市场占有率超过80%,其他厂商也提供了丰富的产品选择,满足不同用户的需求。

5月底的台北电脑展期间,AMD正式发布了基于全新Zen5架构的锐龙线程撕裂者9000系列处理器,包括面向工作站的撕裂者PRO 9000WX系列、面向发烧级桌面的撕裂者9000系列。

近日,文Q参加了AMD在美国加州圣何塞举办的Advancing AI 2025。

期间,AMD不但发布了Instinct MI350系列AI加速卡、ROCm 7开发平台,还解读了撕裂者9000系列处理器、Radeon AI PRO显卡的架构、技术细节,现在分享给大家。

同时,四大OEM伙伴也联合展示了各家的新品。

先感受下192个框框齐头并进的压迫感:

【大杀四方的撕裂者9000系列】

故事还要从一个特殊品类的计算机说起——工作站。

工作站定位介于服务器与个人PC之间,又称图形工作站,一般采用高性能、高可靠性的专业级处理器、显卡、内存、主板等配件,主要用于图形渲染、2D/3D设计、视频编辑、游戏开发、AI加速等工作,在设计与制造(DM)、建筑工程与施工(AEC)、媒体与娱乐(ME)、软件与科学等领域发挥着不可替代的作用。

它可以是一台塔式台式机,可以是一台笔记本,也可以是一台服务器,形式多样。

工作站市场虽然不算很庞大,但相当稳定,而且一直在稳定增长。

IDC数据显示,2024年,全球工作站市场规模接近700万台,而预计到了2029年,将增长至约900万台。

AMD一直有着完善、强大的工作站产品线,尤其是各种高性能处理器,从移动端的锐龙AI PRO系列到桌面级的锐龙PRO、锐龙线程撕裂者PRO系列,再打当Radeon RRO、Radeon AI PRO系列显卡,构成了完整的平台方案。

尤其是撕裂者处理器,2017年诞生以来一直大杀四方,没有任何对手,比如最新的撕裂者PRO 7995WX,多线程性能相比至强W9-3595X领先多达80%。

即便如此,撕裂者系列也一直在飞速进步,比如Zen4架构的撕裂者PRO 7995WX对比Zen初代架构的撕裂者1950X,只用短短6年时间,架构进化了四代,制造工艺从14nm到5nm,核心数增长了6倍(从16核心到96核心),缓存增长了12倍(从40MB到480MB),内存带宽增长了4倍(从四通道DDR4-2666到八通道DDR5-5200),PCIe带宽增长了4倍(从PCIe 3.0到PCIe 5.0)。

当然了,对于专业应用来说,只有强大的硬件性能是远远不够的,更需要成熟的生态应用的配合。

经过多年发展,AMD撕裂者系列已经得到了行业的普遍支持,各种专业软件都做了非常好的优化适配,可充分发挥其多核心、大缓存、丰富I/O等诸多方面的独特优势。

最新的撕裂者9000系列最核心的变化就是升级到最新的Zen5架构,同样可以享受单线程与多线程性能大幅提升、计算负载全流水线优化、512位数据路径AVX-512指令集、增强ISA指令能力、DDR5-6400内存支持、更高能效等提升。

关于Zen5架构的细节变化,我们之前已经做过详细解读,这里不再赘述,只需注意几个关键点:整数ALU单元增至6个以提升处理能力、新一代分支预测精度更高、一级指令缓存拾取容量翻番、一级数据缓存容量增大一半至48KB并支持12路关联、op-cache缓存每时钟周期拾取宽度翻番至6个,等等。

一如既往,撕裂者9000系列的chiplets整合封装更类似EPYC 9005系列,内置最多12个4nm工艺的CCD、1个IOD,每个CCD最多8核心,因此最多就是96核心192线程,没有集成GPU图形核心。

这是Zen5架构单个核心与整体的缓存体系。

单个核心内,一级指令缓存保持32KB 8路关联不变,拾取宽度翻倍;一级数据缓存提升50%而达到48KB 12路关联,支持512b 4个载入和2个存储;一二级缓存之间数据路径,每时钟周期64字节;二级缓存带宽翻倍;三级缓存延迟更低。

每核心1MB二级缓存,每个CCD 8MB二级缓存,所有核心共享32MB三级缓存。

因此,整颗处理器最多96MB二级缓存、384MB三级缓存,合计480MB缓存。

更高的能效也是Zen5架构的一大亮点,包括提升分支预测精度以工作量并显著降低“错误路径”的功耗开销、提升同步多线程的效率以改善单位面积功耗、继续改进功耗栅极、缩短电源状态的切换时间。

得益于更高的能效,Zen5架构可以在同等功耗之下,达到更高的性能水平。

按照官方说法,Zen5对比Zen4,在10个工作站基准测试中平均IPC提升幅度为16%,SPEC AI/ML平均IPC提升幅度更是达到了25%。

再加上略微高了一点的频率……

撕裂者9000系列的主要特性,其中棕色字体是新的变化。

内存支持还是8通道,但频率从DDR5-5200提高到DDR5-6400,理论峰值带宽410GB/s,并且支持EXPO一键超频,最高能超到DDR5-7000+。

PCIe通道虽然没变,但是通过优化内部SoC拓扑结构,提升了有效带宽。

继续兼容sTR5平台,现有主板无需更换。

AMD PRO特性升级,支持AIM-T无线网络。

撕裂者PRO 9000WX系列型号规格一览表,一共六款,和上代一一对应:

9995WX 96核心、9985WX 64核心、9975WX 32核心、9965WX 24核心、9955WX 16核心、9945WX 12核心。

对应型号的基准频率、三级缓存也保持完全一致,加速频率统一从5.3GHz提高到5.4GHz,热设计功耗仍旧都是350W。

撕裂者9000系列型号、规格一览表,一共三款,同样和上代一一对应,仍然没有96核心:

9980X 64核心、9970X 32核心、9960X 24核心。

基准频率、三级缓存也是和对应型号保持不变,加速频率也是从5.3GHz提高到5.4GHz,热设计功耗还都是350W。

相比于专业的撕裂者PRO 9000系列,面向桌面的撕裂者9000系列内存降级为4通道,PCIe 5.0通道减少到80条,去掉了AMD PRO管理特性。

二者都支持超频,但是PRO版本基本不会开放。

另外,撕裂者9000 PRO处理器可以安装在TRX50主板上,但是撕裂者9000系列处理器不能安装在专业的WRX90主板上。

两代旗舰之间,PRO 9995WX对比PRO 7955WX,在不同实际负载中的性能提升幅度都非常可观,至少也有13%,最高达到了26%,这都是Zen5架构的功劳。

PRO 9995WX对比友商最好的工作站处理器至强W9-3595X(60核心120线程),那就是妥妥的全程碾压了,尤其是在CPU敏感型应用中,可以轻松取得超过1倍的领先优势。

即便是在同时需要CPU+GPU的负载中,同样是全面大幅领先。

面对最新的AI工作负载,无论是大模型tokens生成速度,还是文生图速度,又或者创作,PRO 9995WX同样把竞品杀得落花流水。

64核心的非专业级9980X,都是至强W9-3595X无法仰望的存在,至少也可以轻松领先20%以上,最高甚至达到了108%。

【AI新时代的Radeon AI PRO显卡】

专业的工作站不但需要专业的处理器,也需要专业的显卡,尤其是在一些图形相关工作中,显卡的作用有时候甚至更加重要,这也就是为什么叫“图形工作站”。

AMD专业显卡最早叫FirePro,后来更名为Radeon PRO,从现在开始又有了新名字Radeon AI PRO,和锐龙AI处理器一样都是突出AI。

不同层级的处理器、新卡、内存搭配,AMD已经形成了全套AI解决方案,搭配ROCm软件平台,更是如虎添翼。

比如移动端的锐龙AI Max处理器,搭配强大集显、LPDDR内存,主要面向个人推理应用,适合中小型大模型。

工作站级的撕裂者处理器搭配Radeon AI PRO显卡、GDDR内存,可满足多GPU的边缘与本地推理应用,可轻松处理中等模型。

数据中心级的EPYC处理器搭配Instinct加速卡、HBM内存,是大规模训练与推理的首选,面对任何大型大模型都毫无压力。

Radeon AI PRO显卡和Radeon RX 9000系列游戏卡一样,也是基于 RDNA4架构,采用台积电4nm工艺,单芯片,539亿个晶体管,内核面积356.5平方毫米。

新架构改进了指令处理器,优化了缓存系统,包括2MB计算单元缓存、8MB二级缓存、64MB第三代无限缓存,还升级了第二代AI加速器,改进Tensor计算能力,新增8位浮点数据格式,支持结构化稀疏性。

基础架构模块仍然是CU计算单元,但做了全面翻新,两个为一组,增强矩阵操作能力,改进了标量单元、调度器、光追加速器。

首款产品是Radeon AI PRO R9700,拥有64个CU计算单元(4096个流处理器)、64个光追加速器、128个AI加速器,搭配256-bit 32GB GDDR6显存,

峰值性能在FP16半精度浮点下为96 TFLOPS,FP16 Dense可以做到191 TFLOPS,INT4稀疏精度下为1531 TOPS。

整卡功耗300W,和最高端游戏卡RX 9070 XT一样。

值得一提的是,Radeon AI PRO R9700不但有AMD公版,还会有大量的AIB品牌产品,包括华擎、华硕、技嘉、撼迅、蓝宝石、讯景、盈通。

Radeon AI PRO R9700对比上代Radeon PRO W7800,在核心数更少的情况下,实现了FP32性能持平,FP16/BF16性能翻倍,INT8/INT4性能达到4倍,还新增了FP8、结构化稀疏性。

实际性能对比,以DeepSeek-R1大模型输出Tokens速度为例,R9700可以轻松碾压W7800,尤其是在70-80亿参数规模时优势最大,甚至可以领先1倍有余。

选择32GB显存,因为这可以满足流行大模型典型的显存占用,还有一定富裕,从而战未来。

当然,如今的大模型已经不过分追求更多参数、更大体积,对于显存的需求也会在一定时间内保持基本稳定。

Radeon AI PRO R9700还支持灵活的多卡并行,目前最多可以做到四卡,后续将升级到八卡,更好地满足并发实例应用。

比如四卡并行跑DeepSeek-R1 32B蒸馏模型,最多可以做到180个并发,每秒输出Tokens将近1800个,平均每个实例都接近10个。

当然,并发越少,平均输出速度就越快,比如8个实例平均就超过35个Tokens。

【四大OEM伙伴新机首秀】

优秀的硬件产品离不开合作伙伴的大力支持,包括软件、硬件。经过多年培育,撕裂者系列已经得到了行业的广泛认可,“朋友圈”遍天下。

软件生态方面,撕裂者的多核心设计已经得到了众多专业软件的优化适配,遍布各个行业,并且还在不断增加中。

与此同时,AMD自身的ROCm开发平台也在不断进步,为开发者提供更便利的环境,包括ML框架集成、HIP SDK开发包,以及各种编译器、运行时、库,都在日益完善。

硬件方案方面,戴尔、惠普、联想、超微一直紧紧相伴左右,在全球提供大力支持。

在不同的区域性市场,撕裂者系列也有大量的本地伙伴,打造丰富的产品。

戴尔的Precision 7875工作站,支持撕裂者PRO 7000WX/9000WX系列,最多96核心。

它可提供最多八条共2TB DDR5内存、六条PCIe 4.0/5.0扩展插槽、最多六块硬盘(2个内置M.2/2个内置SATA或SAS/2个前置NVMe或SATA或SAS)、1000W/1350W铂金电源,还有最多600W备用电源。

惠普的Z6 G5 A工作站,也已加入撕裂者PRO W9000X系列。

同时,它还支持最新的NVIDIA Blackwell专业显卡,最多三卡并行,还支持1TB DDR5内存、四个4TB前置热插拔硬盘、铂金认证电源。

联想是AMD工作站的头号伙伴,IDC数据显示2020-2025年2月销售了124518台AMD工作站,占AMD工作站市场规模的超过80%!

联想AMD工作站主打ThinkStaion P620、P8,尤其是P8已升级支持撕裂者PRO 9000WX,最多96核心。

它还有最大1TB DDR5内存、最多四个M.2 SSD加三个3.5寸HDD硬盘(最大容量52TB),最多三块RTX PRO显卡、1400W电源等。

超微的AMD工作站是最丰富的,不但有标准的塔式,可选风冷、液冷,更有唯一的2U机架式,可搭配最多四块全高全长双插槽的专业显卡并行(注意第四块隐藏在下边)。

它支持最多96核心,2TB DDR5内存,甚至允许内存超频,八块可热插拔U.3 2.5寸SSD和2个M.2 22110 SSD,采用六个工业级风扇散热。

【结语】

锐龙线程撕裂者2017年诞生以来,一直都是无敌的存在,甚至直接逼迫对手完全放弃了HEDT发烧级桌面市场,创造了微处理器历史上的一个神话,“撕裂者”这个名字可以说起得恰如其分。

一般来说,某个产品如果没有直接竞争威胁,很容易放松懈怠,懒得积极更新,俗称“挤牙膏”,但是撕裂者系列却打破了这个“惯例”,每一代都在超越自我,逐渐让对手再也看不到尾灯。

最新的撕裂者9000系列仍然不忘初心、不改本色,升级了全新的Zen5架构,带来了全新面貌,再次诠释了“AMD YES”的精髓。

无与伦比的性能再次飞跃,无死角碾压竞品;更丰富的I/O,轻松进行各种扩展;更高超的能效,有效降低客户部署成本;第一时间推出的丰富OEM产品,灵活满足用户不同需求……

搭配全新的Radeon AI PRO专业显卡、ROCm 7开发软件,更是组成了迄今最为强大的专业工作站,无论是图形渲染工作,还是高强度AI负载,都可以轻松拿捏。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AMD 锐龙线程撕裂者 Zen5架构 Radeon AI PRO 工作站
相关文章