DeepSeek目标是AGI，不是做空英伟达...

原创信息平权 2025-02-24 20:52 上海

上午第一时间发在星球：

大家更关心的事情，下一个是什么？其实参考这次的FlashMLA，猜测方向大概就是过去已发表论文中的代码实现。不复杂，核心思想大概就是：“论文你们都学不会，ok，代码直接扔你们...”

V3/r1中的招太多了，MTP多token预测、混合精度FP8训练、Dualpipe双重流水线训练、Long CoT长思维链、还有一些底层通信算子的优化。这些原始“手稿”或代码，可能就是后面4天的内容之一。

转头一想，这分明是为英伟达GPU、CUDA库继续增添成功实践模版......进一步巩固和加强了N卡壁垒。这不就是人尽皆知的所谓“CUDA护城河”的完美案例吗？

问了几位身在或非常了解DS团队的老师，情况的确如此：“DeepSeek目前非常依赖N卡或GPGPU” 。现在看当5天repo发布结束，可能不是DS绕过了N卡，而是把N卡用到了极致，玩出了花...

最近国内AI的崛起，引发了一系列“战狼情节”，比如对DS完全绕过英伟达实现国产AI完全自主可控的期待blabla。但实际情况是，DS非常纯粹，目标只有AGI，并不是要为国产卡做多大贡献，也不是为了打掉英伟达多少市值。从务实角度看，DS缺人，也缺时间，英伟达GPU依然是目前最省力、省时间、省资源的方案。

当然国产卡的进步已经非常快，昇腾910实现了国产卡训练，已经是巨大突破（AMD都没做到的事情，华为做到了）。而昇腾与硅基流动合作成功实践了DS r1的推理，优化后性能已经能与hopper看齐。后面4天中，说不定也有非N卡相关的实践。看国内AI capex边际增量最大也是国产算力。但从务实的角度，无论对于DeepSeek还是我们的云厂、infra、应用厂商来说，算力卡只是工具，不是目的，目的是基于工具撬动和转化出更大商业价值。对算力卡的要求，无非是保证稳定供给、性价比、易用性、可得性等综合因素上的平衡。国内角度、更务实的操作，肯定是能进口多少进口多少，买不到就上备选方案...

DS目标是AGI，还真不是做空英伟达

（完）

关于传闻中的288卡、解读YMTC+三星意味着哪些投资机会，欢迎来星球帖子下面讨论

阅读原文

跳转微信打开

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签