原创 信息平权 2025-02-24 20:52 上海
上午第一时间发在星球:
大家更关心的事情,下一个是什么?其实参考这次的FlashMLA,猜测方向大概就是过去已发表论文中的代码实现。不复杂,核心思想大概就是:“论文你们都学不会,ok,代码直接扔你们...”
V3/r1中的招太多了,MTP多token预测、混合精度FP8训练、Dualpipe双重流水线训练、Long CoT长思维链、还有一些底层通信算子的优化。这些原始“手稿”或代码,可能就是后面4天的内容之一。
转头一想,这分明是为英伟达GPU、CUDA库继续增添成功实践模版......进一步巩固和加强了N卡壁垒。这不就是人尽皆知的所谓“CUDA护城河”的完美案例吗?
问了几位身在或非常了解DS团队的老师,情况的确如此:“DeepSeek目前非常依赖N卡或GPGPU” 。现在看当5天repo发布结束,可能不是DS绕过了N卡,而是把N卡用到了极致,玩出了花...
最近国内AI的崛起,引发了一系列“战狼情节”,比如对DS完全绕过英伟达实现国产AI完全自主可控的期待blabla。但实际情况是,DS非常纯粹,目标只有AGI,并不是要为国产卡做多大贡献,也不是为了打掉英伟达多少市值。从务实角度看,DS缺人,也缺时间,英伟达GPU依然是目前最省力、省时间、省资源的方案。
当然国产卡的进步已经非常快,昇腾910实现了国产卡训练,已经是巨大突破(AMD都没做到的事情,华为做到了)。而昇腾与硅基流动合作成功实践了DS r1的推理,优化后性能已经能与hopper看齐。后面4天中,说不定也有非N卡相关的实践。看国内AI capex边际增量最大也是国产算力。但从务实的角度,无论对于DeepSeek还是我们的云厂、infra、应用厂商来说,算力卡只是工具,不是目的,目的是基于工具撬动和转化出更大商业价值。对算力卡的要求,无非是保证稳定供给、性价比、易用性、可得性等综合因素上的平衡。国内角度、更务实的操作,肯定是能进口多少进口多少,买不到就上备选方案...
DS目标是AGI,还真不是做空英伟达
(完)
关于传闻中的288卡、解读YMTC+三星意味着哪些投资机会,欢迎来星球帖子下面讨论