虎嗅 01月29日
DeepSeek被美国质疑“偷窃”,遭OpenAI微软调查,论文曝突破英伟达护城河
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

近期,DeepSeek因涉嫌违规使用OpenAI数据及技术问题引发广泛关注。微软安全研究人员发现DeepSeek可能通过OpenAI的API大规模提取数据,违反了OpenAI的服务条款。同时,美国官员也对其展开国家安全调查,指控其利用OpenAI数据开发自身技术。尽管DeepSeek否认使用了OpenAI数据,并强调其通过强化学习和独特的训练策略实现了高性能,但争议仍在持续发酵。此外,DeepSeek在V3模型中采用的PTX优化技术,绕过CUDA,直接对英伟达GPU进行底层优化,引发了业界对其技术实力的关注,或将对现有AI产业链格局产生影响。

🚨DeepSeek被指控通过OpenAI的API大规模提取数据,可能违反了OpenAI的服务条款,引发了数据合规性争议。

🤔DeepSeek否认使用了OpenAI的数据,并强调通过强化学习和独特的训练策略实现高性能,但美国官员仍对其展开国家安全调查,质疑其技术来源。

🚀DeepSeek V3模型通过PTX优化技术,绕过CUDA,直接对英伟达GPU进行底层优化,提升了性能,这一技术突破或将撼动英伟达的行业地位。

🛠️PTX优化虽然能大幅提升性能,但开发难度和维护成本较高,使得CUDA在未来仍将是主流开发选择,但DeepSeek的尝试显示了突破现有规则的潜力。

春节期间,一场关于DeepSeek的风波正在AI圈掀起波澜。

据彭博社最新报道,微软安全研究人员在去年秋天发现,一些可能与DeepSeek相关的个人通过OpenAI的API大规模提取数据。

知情人士透露,作为OpenAI的技术合作伙伴和最大金主,微软在发现这一情况后立即通知了OpenAI。

报道称,这种行为可能违反OpenAI的服务条款。因为OpenAI的服务条款明确规定,用户不得未经授权使用自动化或程序化方法从其服务中提取数据。

即使DeepSeek获得了某种形式的API访问权限,但如果其使用方式超出了OpenAI授权的范围,比如用于非法或未经授权的商业目的,也可能被视为违反服务条款。

对于相关置评请求,OpenAI未作回应,微软拒绝评论,而DeepSeek方也暂未回应。

值得一提的是,此前许多外界人士认为通过模型蒸馏技术,DeepSeek可能在训练过程中使用了ChatGPT等模型的输出数据作为训练材料,而这些数据中的“知识”被迁移到DeepSeek自己的模型中。

事实上,这种做法在AI领域并不罕见。

但质疑者关注的是DeepSeek是否在未充分披露的情况下使用了OpenAI模型的输出数据。这似乎在DeepSeek-V3的自我认知上也有所体现。

早前就有用户发现,当询问模型的身份时,它会将自己误认为是GPT-4。

DeepSeek团队在最新模型R1的技术报告中明确表示未使用OpenAI模型的输出数据,并表示通过强化学习和独特的训练策略实现了高性能。

例如,采用了多阶段训练方式,包括基础模型训练、强化学习训练、微调等,这种多阶段循环训练方式有助于模型在不同阶段吸收不同的知识和能力。

彭博社报道还指出,美国AI事务主管David Sacks近期在接受Fox News采访时表示,有“确凿证据”表明,DeepSeek利用OpenAI模型的输出数据来开发自身技术。

不过,Sacks并未提供具体的证据。近期,美国多名官员也表示DeepSeek有“偷窃”嫌疑,正对其影响开展国家安全调查。

针对David Sacks的言论,OpenAI的回应则比较保守。其发言人表示“我们知道,来自中国的公司以及其他一些企业,始终在尝试‘蒸馏’美国领先AI公司的模型。”

该发言人强调,作为AI领域的领先者,OpenAI已采取相应对策来保护其知识产权,其中包括对前沿能力的严格筛选,决定哪些功能可以公开发布。他们认为与美国政府密切合作对于保护最先进的AI模型至关重要。

就在这场争议风波持续发酵之际,外媒的目光也开始转向DeepSeek更早发布的开源V3模型,后者则通过技术报告详细披露了相关的深度底层优化细节。

据外媒扒出,V3模型的开发甚至绕过了CUDA,通过对英伟达GPU低级汇编语言PTX进行优化,从而实现了最大性能。

PTX是英伟达GPU的中间指令集架构,能够实现寄存器分配、线程/线程束级别调整等细粒度优化。如果说CUDA是与英伟达GPU对话的“高级语言”,那么PTX就像是一种“机器底层语言”。

想象你在玩一个游戏机。通常情况下,我们只需要用手柄就能玩游戏,这很方便,但可能无法发挥游戏机的全部实力。

而PTX就像是打开了游戏机的后盖,直接调整里面的各种配件和线路。虽然这样做很复杂,需要懂得很多专业知识,但是可以让游戏机跑得更快、性能更好。

更通俗的解释是,PTX就是一种能够让开发者“掀开GPU的盖子”,直接调教其内部运作方式的工具。这就像是改装汽车,不是简单地踩油门,而是直接调教发动机的每个零件,以榨取最大性能。

DeepSeek在训练V3模型时,对H800 GPU进行了重新配置,包括划分出20个SM用于服务器间通信,以及实现了流水线算法,优化能力远超常规CUDA开发水平。而倘若这一技术属实,或将撼动英伟达构筑已久的护城河。

图片截图来自 DeepSeek v3 技术报告

不过,PTX虽然能极大地优化性能,但也对开发团队提出了更高的要求。相比之下,英伟达的护城河CUDA凭借其开发便捷性和快速迭代的优势,仍然是大多数开发者的首选。

更重要的是,PTX优化往往需要针对特定型号的硬件进行定制。

这种“量体裁衣”式的优化策略虽然效果显著,但也大大增加了开发难度和维护成本。这也解释了为什么在可预见的未来,CUDA仍将在主流开发中占据主导地位。

但在既有规则之外寻求突破,往往就是颠覆的开始,DeepSeek这次在海内外掀起的技术浪潮或将有望撬动整个AI产业链的既有秩序。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek OpenAI PTX优化 数据合规 AI技术
相关文章