快科技资讯 02月05日
曝DeepSeek绕过CUDA!为适配中国国产GPU做准备 跳出英伟达限制
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek大语言模型通过绕过英伟达的CUDA框架,直接使用底层硬件指令PTX语言进行优化,引发了对GPU算力限制的关注。此举表明DeepSeek在H800芯片训练中,将优化做到了极致,为未来兼容国产GPU芯片做准备。绕过CUDA虽增加了开发难度,但可实现更细粒度的操作,方便适配国产硬件。这一突破不仅展现了DeepSeek非凡的工程水平,也反映了美国对华制裁背景下,中国企业在GPU短缺危机中的紧迫感和创造力。这或将加速国产GPU的发展,打破英伟达在AI芯片领域的垄断地位。

🚀DeepSeek大模型另辟蹊径,在英伟达H800芯片训练中,没有采用通用的CUDA高级编程语言,而是选择使用更底层的PTX指令,以实现极致优化。

🛠️绕过CUDA,意味着DeepSeek需要投入更多精力进行底层优化,虽增加了开发难度,但也能够根据GPU的驱动函数进行定制化开发,实现更细粒度的控制。

🇨🇳此举为DeepSeek未来兼容国产GPU芯片铺平了道路。通过了解国产硬件驱动提供的基本函数接口,DeepSeek可以更容易地将自家大模型适配到国产硬件上。

💡DeepSeek的突破,体现了中国科技企业在外部压力下的创新能力和工程实力,也为国产GPU的发展带来了新的机遇。

快科技2月5日消息,DeepSeek全球爆火,再一次引发外界对GPU算力限制话题的关注。

据报道,DeepSeek开发的大语言模型绕过了英伟达的CUDA框架,正为未来兼容国产GPU芯片做准备。

众所周知,英伟达的CUDA(Compute Unified Device Architecture,统一运算架构)能大幅降低研发大模型的难度,获全球开发商使用,一举将英伟达推上AI芯片领域的垄断地位。

但最新发现显示,DeepSeek使用英伟达的H800芯片训练时,使用英伟达底层硬件指令PTX(Parallel Thread Execution)语言,而非高级编程语言CUDA。

这样意味着DeepSeek绕过了CUDA,使用更底层的编程语言做优化。

对于程序开发人员来说,CUDA是一种更加友好的高级语言,开发者只需要专注于程序和算法最相关的运行逻辑,而不太需要考虑具体的程序是如何在GPU等硬件上具体如何执行计算的,从而能够降低开发难度。

而PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread / Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。

换句话说,DeepSeek把优化做到了极致。

北京航空航天大学副教授黄雷表示,绕过CUDA可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。

这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。假如它之后使用国产GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一些基本函数接口,就可以仿照英伟达GPU硬件的编程接口去写相关的代码,从而让自家大模型更加容易适配国产硬件。

“这凸显了DeepSeek非凡的工程水平,并表明美国对华制裁加剧的“GPU短缺危机”激发了他们紧迫感和创造力。”韩国Mirae Asset Securities Research的一名分析师表示。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek CUDA PTX 国产GPU 大语言模型
相关文章