最新-新浪科技科学探索 02月05日
DeepSeek引发美国地震!怀疑中国通过新加坡获取NVIDIA AI芯片
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek大模型表现出色,性能与OpenAI O1相当且训练成本低,引发美国猜疑和调查。该模型训练硬件情况及相关各方的反应受到关注。

DeepSeek大模型性能出色,训练成本低,用2048颗H800 GPU训练V3大模型。

Meta花更多硬件成本训练Llama 3大模型,与DeepSeek形成对比。

半导体研究机构认为DeepSeek囤积大量NVIDIA GPU,存在违规获取嫌疑。

美国调查DeepSeek是否通过新加坡公司获得管制出口的GPU。

快科技2月3日消息,DeepSeek大模型的出色表现引发美国AI行业上下震动,不仅性能与OpenAI O1旗鼓相当,更关键的是训练成本低得多,也引发了美国政府的猜疑和调查,新加坡都被牵扯进来。

DeepSeek官方没有详细披露大模型训练的硬件规模,只说用了数量有限的2048颗H800 GPU,在两个月内训练了6710亿个参数的V3大模型,相当于280万个GPU小时。

相比之下,Meta花了16381颗H100 GPU、54天实现,训练了4050亿个参数的Llama 3大模型,相当于3080万个GPU小时,硬件成本相差多达11倍。

半导体研究机构SemiAccurate提出,DeepSeek应该囤积了大约6万颗NVIDIA GPU,包括1万颗A100、1万颗H100、1万颗H800、3万颗H20,总成本超过140亿元。

其中,A100、H100始终都在美国限制对华出口只列,H800作为特供版一度合规,之后也被限制,目前只有H20是完全合规的。

欧美普遍认为,DeepSeek通过美国出口监管漏洞,获得了NVIDIA高端的H100 GPU,而且数量不少,最多可能有5万颗。

根据NVIDIA的财报,2022年底,美国刚刚限制AI芯片对华出口的时候,新加坡贡献的收入占比只有9%,但是到了现在,这个比例已经高达22%,显得很不正常。

因此,美国白宫、FBI等机构正在调查,DeepSeek是否通过位于新加坡的第三方公司,获得了管制出口的NVIDIA AI GPU。

同时,美国有关人士呼吁对新加坡进出口采取更严格的监督、管控措施,避免受限产品转而进入中国。

不过,截至目前,美国政府尚未发现任何确凿证据。

NVIDIA则回应称,已知严格遵守法律要求,与新加坡的大多数交易都是运往其他地方的货物,而不是中国。

NVIDIA强调,与新加坡相关的收入并不意味着转移到中国,其公开文件显示的是客户账单地址而非发货地址。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:上方文Q

文章内容举报

]article_adlist-->

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek大模型 训练成本 NVIDIA GPU 美国调查
相关文章