Cnbeta 2024年12月13日
AMD提早一年实现将处理器效能提升30倍的目标
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

AMD的MI300X AI芯片提前一年实现了其设定的能效目标,相较2020年提升了近30倍。通过实际测试,搭载该芯片的服务器在Llama3.1-70B模型推理上的能源效率是旧机的28.3倍。能效提升得益于硬件改进、架构进步和软件优化。此外,AMD还发布了新款AI芯片MI325X,它在MI300X基础上增强了HBM内存,单卡和八卡平台的推理性能均领先NVIDIA H200,训练性能单卡领先,八卡平台持平。MI325X预计将在今年四季度投产。

🎯AMD的MI300X AI芯片提前一年实现了能效目标,相较2020年提升近30倍,实际测试中,新服务器的能源效率是旧机的28.3倍。

🚀能效提升归功于硬件的改进、架构的进步以及软件的优化,而非单一因素的突破。

🧠新款AI芯片MI325X在MI300X基础上增强了HBM内存,单卡配备256GB HBM3E内存,支持八卡并行,总性能强大。在推理性能上,MI325X领先NVIDIA H200 20-40%,训练性能单卡领先10%,八卡平台持平。

📅MI325X加速卡和平台将在今年四季度投产,合作伙伴的整机系统和解决方案预计从明年一季度起陆续推出。

早在四年前,AMD就曾设定目标,到2025年EPYC系列服务器处理器和Instinct系列AI芯片的能效,较2020年提高30倍。如今,MI300X AI芯片基本上实现目标,时间提了早一年。据THW报道,AMD两个64核心EPYC 9575F CPU、八个Instinct MI300X AI芯片及2304GB DDR5内存的服务器,Llama3.1-70B(vLLM 0.6.1.post2、TP8)测试推理性能,用一组复杂计算确定系统能源效率,并与2020年的旧机器比较,

结果显示,新机能源效率是旧机的28.3倍。

不过,AMD并未透露2020年的旧机是何规格。但大概率是EPYC 7002系列,Zen 2架构,每个CPU最多64个核心,以及CDNA 1架构Instinct MI100 AI芯片。

AMD表示,除了强力硬件改进,更高性能效率是架构进步,加上软件优化结合,是跳跃式进展。

今年10月份的Advancing AI 2024大会上,AMD正式发布了新款AI芯片——GPU加速卡“Instinct MI325X”。它在大获成功的MI300X基础上再进一步,主要是增强了HBM内存部分。

MI325X配备了多达256GB HBM3E内存,相比于MI300X又增加了64GB。

MI325X也支持八块并行组成一个平台,这就有多达2TB HBM3E、48TB/s带宽,总的性能高达FP16 10.4 PFlops(每秒1.04亿亿次)、FP8 20.8 PFlops(每秒2.08亿亿次)。

对比NVIDIA H200,无论单卡还是八卡平台,不同大模型推理的性能都可以领先20-40%

训练性能方面,单卡可领先H200 10%,八卡平台则是持平。

MI325X加速卡和平台将在四季度内投产,而合作伙伴的整机系统、基础架构解决方案,将从明年第一季度起连续推出。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AMD AI芯片 能效 MI300X MI325X
相关文章