快科技资讯 前天 21:23
刚完硬件刚软件 AMD确认AI软件3倍性能提升:CUDA之敌
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

AMD正通过其ROCm 7软件生态系统积极进军AI市场,旨在打破NVIDIA在该领域的垄断地位。ROCm 7相较于上一代在推理和训练方面性能提升了3倍以上,并增加了对大规模训练、分布式推理和低精度数据类型的支持。AMD通过推出ROCm夜间构建版本、扩大即时计算基础设施访问以及发布首个开发者云,积极与开发者合作,简化AI模型的部署和使用。CEO苏姿丰强调了ROCm 7在性能、易用性和采用范围方面的显著进展,特别是在Llama 3.1 70B等模型上的测试结果表现突出。未来,ROCm 7还将扩展对锐龙平台笔记本/工作站以及Windows系统的支持,逐步解决开发者社区的痛点,为AMD在AI硬件之外的软件生态建设注入强劲动力。

🚀 AMD ROCm 7软件是其在AI市场挑战NVIDIA的关键策略,通过强大的软件生态系统来弥补硬件上的竞争劣势。ROCm 7对整个软件栈进行了重大升级,旨在提升AI模型训练和推理的性能与效率。

📈 ROCm 7在性能上实现了显著飞跃,与上一代相比,推理和训练性能提升了3倍以上。它还增加了对大规模训练、分布式推理和低精度数据类型等关键AI应用场景的支持,满足了日益增长的AI模型复杂化需求。

🤝 AMD正积极加强与开发者的合作,通过推出ROCm夜间构建版本、扩大即时计算基础设施访问以及发布首个开发者云,为开发者提供更便捷的开发环境和工具。这有助于吸引更多开发者加入AMD的生态系统,构建更完善的软件生态。

📊 ROCm 7在实际AI模型测试中表现出色,例如在Llama 3.1 70B模型上性能提升3.2倍,在Qwen2-72B上提升3.4倍,在DeepSeek R1上提升3.8倍。训练任务方面,在Llama 2 70B等模型上平均性能提升3倍,证明了其在主流AI模型上的强大实力。

🔧 AMD正逐步解决开发者社区长期以来对ROCm生态的抱怨,未来将不断提升生态支持,包括加入对锐龙平台笔记本/工作站的支持,以及正式支持Windows系统。这些改进将大大拓宽ROCm的应用范围和易用性。

快科技8月9日消息,在AI市场上NVIDIA占据了95%的份额,这不仅是他们的AI显卡硬件性能强大,还得益于CUDA的软件生态更完善,毕竟16年来积累了400多万开发者,这是NVIDIA最大的护城河。

AMD在AI市场上想抢占更多份额,除了明年推出性能40PFlops(4亿亿次每秒)的MI400加速卡之外,还要在软件生态上取得突破,这方面就得靠AMD的ROCm软件了,而且还是开源开放的生态。

今年6月份AMD官宣了最新的ROCm 7软件,专为性能、兼容性和灵活性而设计,在推理和训练方面提供了重大增强,支持许多开箱即用的最新AI模型,并将AMD开放生态系统从云扩展到边缘。

在日前的财报会议上,CEO苏姿丰也提到了ROCm 7的诸多优点,强调在这一财季中AMD取得了重大进展,提高了ROCm7的性能、易用性并扩大了其采用范围。

苏姿丰表示,我们发布了 ROCm7,对整个软件栈的每一层都进行了重大升级,与上一代相比,推理和训练性能提升了3倍以上,并增加了对大规模训练、分布式推理和低精度数据类型的支持。

为了加强与开发者的合作,AMD推出了 ROCm夜间构建版本,并扩大了即时计算基础设施的访问范围,包括推出了AMD首个开发者云,该云提供预配置的容器,可即时访问 AMD GPU。

在此前的发布会上,AMD还提供了ROCm7的实测结果,在Llama 3.1 70B模型上性能提升 3.2倍,Qwen2-72B上性能提升3.4倍,而DeepSeek R1性能提升3.8倍。

在训练任务上,Llama 2 70B、Llama 3.1 8B、Qwen 1.5 7B模型上平均性能提升3倍。

今年内ROCm7还会不断提升生态支持,加入对锐龙平台笔记本/工作站的支持,完整支持Linux系统,还会正式加入对Windows系统的支持,可以说之前备受开发者吐槽的问题正在逐步解决。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AMD ROCm 7 AI软件 NVIDIA 深度学习
相关文章