快科技资讯 02月02日
绕开英伟达护城河CUDA!消息称DeepSeek准备适配国产GPU
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek在研发大模型时,选择绕过英伟达的CUDA,直接基于GPU驱动函数进行开发,实现更细粒度的操作。此举使得DeepSeek在多节点通信时,通过使用PTX,以算法方式高效利用硬件加速,大幅缩短模型训练时间。这不仅让DeepSeek在同等时间内能喂给模型更多数据,提高模型效果,也为其未来适配国产GPU打下基础。绕过CUDA,意味着DeepSeek能更灵活地控制硬件资源,并降低对英伟达的依赖,这在行业内引发了广泛关注。

🚀DeepSeek研发大模型时,选择绕过英伟达的CUDA,直接基于GPU驱动函数进行开发,实现更细粒度的操作。

⚙️DeepSeek通过使用PTX,以算法方式高效利用硬件加速,大幅缩短模型训练时间。例如,其他模型训练需十天,DeepSeek仅需五天,从而能给模型喂更多数据,间接提高模型效果。

🛠️DeepSeek拥有擅长PTX语言的内部开发者,未来使用国产GPU时,能更容易适配硬件,仿照英伟达GPU硬件的编程接口编写相关代码,让自家大模型更易适配国产硬件。

快科技2月2日消息,据国内媒体报道称,DeepSeek在研发大模型时绕过了英伟达的护城河CUDA,这让美国不少巨头们感到了很大的威胁,而现在这件事才刚刚开始。

DeepSeek真的绕过了CUDA,那这件事意味着什么?对此,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA,可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。

譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 PTX(Parallel Thread Execution),其最多只能实现以算法的方式来高效利用硬件层面的加速。

一旦速度变得更快,打个比方这就意味着别人家的模型要训练十天,而DeepSeek只需要训练五天,那么就能给模型喂更多的数据,即能让模型在同等时间内看到更多的数据,间接提高模型的效果。

按照消息人士的说法,DeepSeek拥有一些擅长写PTX语言的内部开发者。

那么,假如它之后使用国产GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一些基本函数接口,就可以仿照英伟达GPU硬件的编程接口去写相关的代码,从而让自家大模型更加容易适配国产硬件。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek CUDA PTX 国产GPU 大模型
相关文章