DeepSeek引发美国地震！怀疑中国通过新加坡获取NVIDIA AI芯片

快科技资讯 02月03日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

DeepSeek大模型以远低于OpenAI的成本实现性能对标，引发美国AI行业震动。其训练仅用少量H800 GPU，在短时间内完成庞大参数模型的训练，与Meta相比，硬件成本差异巨大。美国怀疑DeepSeek通过新加坡规避出口管制，获取大量NVIDIA高端GPU，并对新加坡的进出口贸易展开调查，尽管目前尚未发现确凿证据。NVIDIA回应称遵守法律，新加坡交易多为转运，而非最终目的地为中国。事件凸显中美AI竞争背景下，技术与地缘政治的复杂交织。

🚀DeepSeek大模型仅用2048颗H800 GPU，两个月内训练出6710亿参数的V3模型，训练成本远低于OpenAI，引发美国AI行业的高度关注。

💰与Meta相比，DeepSeek训练同等规模的模型，硬件成本相差高达11倍，Meta使用了16381颗H100 GPU，耗时54天，训练了4050亿参数的Llama 3模型，DeepSeek的低成本优势显著。

🕵️‍♀️美国怀疑DeepSeek通过新加坡的第三方公司，规避出口管制，获得了大量NVIDIA高端GPU，并展开调查。美国政府担忧受限产品流入中国，可能采取更严格的监督措施。

🌍NVIDIA回应称，其与新加坡的大部分交易为转运货物，而非最终目的地为中国，强调遵守法律，并指出客户账单地址与发货地址不同，以此回应美国方面的质疑。

快科技2月3日消息，DeepSeek大模型的出色表现引发美国AI行业上下震动，不仅性能与OpenAI O1旗鼓相当，更关键的是训练成本低得多，也引发了美国政府的猜疑和调查，新加坡都被牵扯进来。

DeepSeek官方没有详细披露大模型训练的硬件规模，只说用了数量有限的2048颗H800 GPU，在两个月内训练了6710亿个参数的V3大模型，相当于280万个GPU小时。

相比之下，Meta花了16381颗H100 GPU、54天实现，训练了4050亿个参数的Llama 3大模型，相当于3080万个GPU小时，硬件成本相差多达11倍。

半导体研究机构SemiAccurate提出，DeepSeek应该囤积了大约6万颗NVIDIA GPU，包括1万颗A100、1万颗H100、1万颗H800、3万颗H20，总成本超过140亿元。

其中，A100、H100始终都在美国限制对华出口只列，H800作为特供版一度合规，之后也被限制，目前只有H20是完全合规的。

欧美普遍认为，DeepSeek通过美国出口监管漏洞，获得了NVIDIA高端的H100 GPU，而且数量不少，最多可能有5万颗。

根据NVIDIA的财报，2022年底，美国刚刚限制AI芯片对华出口的时候，新加坡贡献的收入占比只有9％，但是到了现在，这个比例已经高达22％，显得很不正常。

因此，美国白宫、FBI等机构正在调查，DeepSeek是否通过位于新加坡的第三方公司，获得了管制出口的NVIDIA AI GPU。

同时，美国有关人士呼吁对新加坡进出口采取更严格的监督、管控措施，避免受限产品转而进入中国。

不过，截至目前，美国政府尚未发现任何确凿证据。

NVIDIA则回应称，已知严格遵守法律要求，与新加坡的大多数交易都是运往其他地方的货物，而不是中国。

NVIDIA强调，与新加坡相关的收入并不意味着转移到中国，其公开文件显示的是客户账单地址而非发货地址。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签