快科技资讯 前天 14:16
大提速3.8倍!AMD GPU终于优化Stable Diffusion
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

AMD发布针对Stable Diffusion模型的优化,旨在提升其在AMD Radeon显卡和锐龙集显上的推理性能。通过与OSV、OEM、ISV厂商合作,AMD优化了硬件、驱动程序、编译器等,使得SDXL 1.0、SDXL Turbo等模型在AMD硬件上的速度提升高达3.8倍。用户现已可在Stability AI或Hugging Face上下载优化后的模型,并体验Amuse 3.0带来的性能提升,但需注意GPU驱动版本要求。

🚀 AMD通过与合作伙伴的紧密合作,显著提升了其硬件在AI应用中的性能。优化涵盖硬件设计、驱动程序、编译器和机器学习模型等多个层面,旨在提供更流畅、更高效的AI体验。

📈 经过优化,Stable Diffusion模型在AMD硬件上的推理速度有了显著提升。例如,SDXL 1.0和SDXL Turbo的性能提升最高可达3.8倍,SD3.5则可提升最多2.6倍。在实际应用中,RX 9070 XT显卡上的SDXL 1.0、SDXL Turbo、SD3.5 Large、SD3.5 Large Turbo的效率分别提升了3.1倍、1.5倍、3.3倍、2.1倍。

💾 优化后的Stable Diffusion模型带有“_amdgpu”后缀,用户可在Stability AI或Hugging Face上下载。此外,用户还可以使用AMD、TensorStack AI联合打造的最新版Amuse 3.0。为了获得最佳性能,建议使用不低于24.30.31.05预览版的AMD GPU驱动,或者等待即将发布的25.4.1正式版。

快科技4月18日消息,NVIDIA AI之强大,不仅仅在于硬件性能好,更离不开生态优化适配,可以发挥最佳效率,AMD相比之下就差了很多,但也在努力追赶。

现在,Stability AI发布了ONNX框架优化的Stable Diffusion模型,在兼容的AMD Radeon显卡、锐龙集显上最多可以提速达3.8倍。

AMD表示,过去一年来,一直在与OSV、OEM、ISV厂商合作,优化AMD硬件上的AI应用,包括硬件设计、驱动程序、编译器、机器学习模型等等。

根据官方公布的数据,经过优化之后,SDXL 1.0、SDXL Turbo在AMD硬件上的推理性能,对比基础的PyTroch模型最高提升3.8倍,SD3.5则可提升最多2.6倍。

实际图片、视频生成应用中,SDXL 1.0、SDXL Turbo、SD3.5 Large、SD3.5 Large Turbo在RX 9070 XT显卡上的效率分别提升了3.1倍、1.5倍、3.3倍、2.1倍。

SDXL 1.0、SD3.5 Large、SD3.5 Large Turbo在锐龙AI MAX+ 395上的效率,则分别提升了1.4倍、3.3倍、3.0倍。

AMD硬件优化版的Stable Diffusion模型有一个特殊的“_amdgpu”后缀标记(比如stable-diffusion-3.5-large_amdgpu),现在已经可以在Stability AI或者Hugging Face上下载了。

你也可以使用AMD、TensorStack AI联合打造的最新版Amuse 3.0。

注意,AMD GPU驱动版本不要低于24.30.31.05预览版,或者等待即将发布的25.4.1正式版。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AMD Stable Diffusion AI 优化 GPU
相关文章