信息平权 02月25日
DeepSeek目标是AGI,不是做空英伟达...
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek的代码开源引发了业界对AI发展方向的讨论。文章指出,DeepSeek并非要绕过英伟达,而是将其GPU利用到极致,巩固了N卡的壁垒。DeepSeek专注于AGI,务实地选择了英伟达GPU作为最省力方案。尽管国产算力进步迅速,如昇腾910实现了训练突破,但算力卡只是工具,目的是创造商业价值。国内厂商在算力选择上,仍倾向于优先进口,再考虑备选方案。DeepSeek的目标并非做空英伟达,而是追求AGI,国内AI的崛起不应被过度解读为“战狼情节”。

🚀DeepSeek开源代码的核心思想是将已发表论文中的代码实现直接提供给用户,降低学习门槛,方便开发者快速上手。

💡DeepSeek的代码实践中,充分利用了英伟达GPU和CUDA库,通过MTP多token预测、混合精度FP8训练、Dualpipe双重流水线训练、Long CoT长思维链等技术,进一步巩固和加强了N卡壁垒。

🤝DeepSeek在算力选择上,务实地选择了英伟达GPU作为最省力、省时间、省资源的方案,但同时也关注国产算力的进步,如昇腾910在训练方面的突破,以及与硅基流动合作在推理方面的优化。

💰国内AI Capex边际增量最大的是国产算力,但算力卡只是工具,目的是基于工具撬动和转化出更大商业价值,国内厂商在算力选择上,倾向于优先进口,再考虑备选方案。

原创 信息平权 2025-02-24 20:52 上海

上午第一时间发在星球:

大家更关心的事情,下一个是什么?其实参考这次的FlashMLA,猜测方向大概就是过去已发表论文中的代码实现。不复杂,核心思想大概就是:“论文你们都学不会,ok,代码直接扔你们...”

V3/r1中的招太多了,MTP多token预测、混合精度FP8训练Dualpipe双重流水线训练、Long CoT长思维链、还有一些底层通信算子的优化。这些原始“手稿”或代码,可能就是后面4天的内容之一。

转头一想,这分明是为英伟达GPU、CUDA库继续增添成功实践模版......进一步巩固和加强了N卡壁垒。这不就是人尽皆知的所谓“CUDA护城河”的完美案例吗?

问了几位身在或非常了解DS团队的老师,情况的确如此:DeepSeek目前非常依赖N卡或GPGPU” 。现在看当5天repo发布结束,可能不是DS绕过了N卡,而是把N卡用到了极致,玩出了花...

最近国内AI的崛起,引发了一系列“战狼情节”,比如对DS完全绕过英伟达实现国产AI完全自主可控的期待blabla。但实际情况是,DS非常纯粹,目标只有AGI,并不是要为国产卡做多大贡献,也不是为了打掉英伟达多少市值。从务实角度看,DS缺人,也缺时间,英伟达GPU依然是目前最省力、省时间、省资源的方案。

当然国产卡的进步已经非常快,昇腾910实现了国产卡训练,已经是巨大突破(AMD都没做到的事情,华为做到了)。而昇腾与硅基流动合作成功实践了DS r1的推理,优化后性能已经能与hopper看齐。后面4天中,说不定也有非N卡相关的实践。看国内AI capex边际增量最也是国产算力。但从务实的角度,无论对于DeepSeek还是我们的云厂、infra、应用厂商来说,算力卡只是工具,不是目的,目的是基于工具撬动和转化出更大商业价值。对算力卡的要求,无非是保证稳定供给、性价比、易用性、可得性等综合因素上的平衡。国内角度、更务实的操作,肯定是能进口多少进口多少,买不到就上备选方案...

DS目标是AGI,还真不是做空英伟达

(完)

关于传闻中的288卡、解读YMTC+三星意味着哪些投资机会,欢迎来星球帖子下面讨论

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek 英伟达 国产算力 AGI CUDA
相关文章