最新-新浪科技科学探索 2024年10月11日
288GB海量内存!AMD官宣下代GPU加速卡Instinct MI355X:3nm CNDA4全新架构
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

AMD正式发布升级版Instinct MI325X GPU加速卡,并宣布全新下一代Instinct MI350系列首款产品MI355X,披露部分规格与性能数据。MI355X将于2025年下半年上市,采用台积电3nm工艺等,性能飞跃,未来还将推出MI400系列。

🏢AMD发布全新Instinct MI350系列首款产品MI355X,2025年下半年上市,采用台积电3nm工艺,首次采用CDNA 4架构,引入FP6、FP4浮点数据类型,搭配288GB的HBM3E内存。

💻MI355X的FP6、FP4浮点性能均为9.2 PFlops,同时将FP16、FP8性能提升80%,分别达2.3 PFlops、4.6 PFlops。单卡288GB HBM3E内存无可匹敌,带宽高达8TB/s。

📈MI355X支持单平台八卡,总计2.3TB HBM3E内存、64TB/s带宽,性能强大。与MI300X相比,FP16性能达7.4倍,HBM容量为1.5倍,处理模型参数规模增加6倍。

快科技10月11日美国旧金山现场报道:

除了正式发布升级版的Instinct MI325X GPU加速卡,AMD还宣布了全新的下一代Instinct MI350系列的首款产品“Instinct MI355X”,并披露了部分规格、性能数据。

MI355X将在2025年下半年上市,也就是还有差不多一年时间。

MI350系列将首次升级为台积电3nm工艺,首次采用CDNA 4架构,首次引入FP6、FP4浮点数据类型,搭配内存还是HBM3E但是容量高达288GB。

具体功耗没有披露,但是MI325X已经最高达1000W,AMD也透露MI355X会顺应行业趋势(NVIDIA B200 1000W、GB200 1700W),因此必然会显著超过1000W。

FP6、FP4都属于浮点数据格式,分别代表6位、4位精度,也就是只需6位、4位就能表达一个数字,相比于FP16、F8精度大大降低,但是数据处理量也大大减少,适合大模型的量化,特别是大语言模型和混合专家模型。

如果你不需要太高的精度,更想要速度,FP6、FP4就非常适合。

MI355X上的FP6、FP4浮点性能都是9.2 PFlops(每秒9200万亿次运算),同时还将FP16、FP8性能都提升了80%,分别达到2.3 PFlops、4.6 PFlops。

NVIDIA Blackwell GPU同样引入了FP6、FP4精度,但是性能更高,分别达20 PFlops、40 PFlops。

单卡多达288GB HBM3E内存确实是无可匹敌,同时带宽高达8TB/s。

对比MI325X分别多出1/8、1/3,而相比目前已上市的MI300X都增加了足足50%。

对比竞品,Blackwell B200也只有192GB HBM3E,但带宽同样做到了8TB/s。

MI355X同样支持单平台八卡,这样就有总计2.3TB HBME内存、64TB/s带宽,性能更是高达FP16 18.5 PFlops、FP8 37 PFlops、FP6/FP4 74 PFlops。

它也将在明年下半年供货。

Instinct系列的性能进步幅度无疑是飞跃性的,一代一个新模样,跨代对比更是惊人。

MI355X对比MI300X,FP16性能达到了7.4倍之多,HBM容量也有1.5倍,所能处理的模型参数规模,也从7140亿增加到4.2万亿,足足6倍之多。

展望未来,2026年将推出再下一代的Instinct MI400系列,基于再下一代的CDNA架构(CDNA 5?),规格和性能必将再次迈上一个大大的台阶。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:上方文Q

文章内容举报

]article_adlist-->

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AMD Instinct MI355X GPU加速卡 性能提升
相关文章