消息称DeepSeek准备适配国产GPU

Cnbeta 02月02日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

DeepSeek在研发大模型时选择绕过英伟达的CUDA，直接利用GPU驱动函数进行开发，从而实现更细粒度的操作。通过使用PTX进行多节点通信，DeepSeek能够以算法方式高效利用硬件加速，大幅缩短模型训练时间。这种技术优势使DeepSeek能喂给模型更多数据，间接提高模型效果。此外，DeepSeek具备PTX语言开发能力，使其在适配国产GPU时更具优势，能仿照英伟达GPU的编程接口编写代码，从而更轻松地适配国产硬件。

🚀DeepSeek研发大模型时，选择绕过英伟达CUDA，直接基于GPU驱动函数进行开发，实现更细粒度的操作。

💡DeepSeek通过使用PTX进行多节点通信，以算法方式高效利用硬件加速，显著缩短模型训练时间，提升模型训练效率。

🎯DeepSeek内部拥有擅长PTX语言的开发者，使其在适配国产GPU时更具优势，能更轻松地适配国产硬件，实现自主可控。

DeepSeek在研发大模型时绕过了英伟达的护城河CUDA，这让美国不少巨头们感到了很大的威胁，而现在这件事才刚刚开始。DeepSeek真的绕过了CUDA，那这件事意味着什么？对此，北京航空航天大学黄雷副教授接受采访时表示，绕过CUDA，可以直接根据GPU的驱动函数做一些新的开发，从而实现更加细粒度的操作。

譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 PTX（Parallel Thread Execution），其最多只能实现以算法的方式来高效利用硬件层面的加速。

一旦速度变得更快，打个比方这就意味着别人家的模型要训练十天，而DeepSeek只需要训练五天，那么就能给模型喂更多的数据，即能让模型在同等时间内看到更多的数据，间接提高模型的效果。

按照消息人士的说法，DeepSeek拥有一些擅长写PTX语言的内部开发者。

那么，假如它之后使用国产GPU，其在硬件适配方面将会更得心应手，其只要了解这些硬件驱动提供的一些基本函数接口，就可以仿照英伟达GPU硬件的编程接口去写相关的代码，从而让自家大模型更加容易适配国产硬件。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签