调研纪要 02月15日
开局
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek的AI应用引发港股震荡,云业务迎来新估值机遇。DeepSeek-R1/V3接入各大云平台,其卓越性能颠覆了传统云盈利模式。美国关税落地和春节消费亮点也助推了港股上涨,其中港股IT公司涨幅显著。DeepSeek的出现标志着scaling law放缓和模型平权,国内云厂商有望复刻海外巨头云业务的成功,迎来利润率和规模的双击。此外,产业链价值再分配,应用端成为重点,国产算力需求激增,但仍需提升产品竞争力。

🚀DeepSeek的AI应用引发港股震荡,云业务迎来新估值机遇。DeepSeek-R1/V3接入亚马逊AWS、微软、腾讯云等平台,其卓越性能颠覆了传统云盈利模式,为国内云厂商带来利润率和规模双击的趋势。

💰DeepSeek通过工程优化实现降本,其MoE架构利用共享专家、均衡函数、MTP机制一次性预测多个token,降低了对标注数据的依赖,增强了推理效果,挑战了OAI和英伟达的超额利润。

💡AI平权是开源对闭源的挑战,可能抹平OAI和英伟达链的霸权。未来产业链价值将从算力到应用渡让,应用成为最重要的方向,应优选有场景定价权的公司,并关注端侧和AI Agent。

☁️国内云市场潜力巨大,阿里和腾讯等巨头在云业务上的估值仍有提升空间。DeepSeek的出现有望推动国内云厂商的利润率和规模双击,重新进行估值。

2025-02-04 23:51 广东

蛇年,港股先行。这两天港股先抑后扬,今日更跳空高开且显著上行。

催化剂主要来自于几点:一是DeepSeek掀起的AI应用。亚马逊AWS、微软、腾讯云、阿里云、华为云、百度云等先后接入DeepSeek-R1/V3。确实,DeepSeek好用,只要一试,就知道好。二是美国加征关税的靴子落地。三是春节期间消费有亮点,比如电影票房火热。

领先者领先,好的开局。


港股IT公司涨幅最大:金山云(+44.2%),云业务如何影响互联网巨头的估值空间?

Deepseek出现之后,将直接颠覆云的盈利模式。过去多年,国内云厂由于客户要求定制化开发,利润率整体极低或者亏损,24年国内云的逻辑没有演绎,核心卡在了模型差距大,而deepseek就是scaling law放缓和模型平权的标志性事件,意味着24年海外巨头价值创造最明显的业务云,将有望在国内复刻,国内云厂即将迎来利润率和规模双击的趋势,重新进行估值!你不上云怎么搞ai应用?你就落后。

拿阿里举例,阿里目前市值里云给的都是负估值,市场仅讨论电商业务的竞争。腾讯,为什么金融科技企业服务业务毛利率会持续上升,云也有不少贡献。海外云厂基本上交易在25年10x ps左右。更重要的是,AI的拉动下,保守估计海外云市场已经在过去1年半涨出了一万亿美元以上的市值。而国内,全部巨头加在一起,可能连千亿rmb的市值都没有给到。

重视云,阿里 腾讯 金山云。腾讯还有广告业务。广告是另外一个海外过去一年半涨出万亿以上市值的场景。


产业链的价值再分配:

1)美股跌了这么多不完全是因为DS成本的明确下降,而是对行业认知的重塑。过去OAI这样的头部厂商的超额利润是来自于模型能力,而模型能力是依靠Capex和先发优势堆出来的。但现在如果DS可以在短时间内复现头部模型能力,这就把OAI的超额利润打掉了,也因此威胁了英伟达获得超额利润的根基。大家可以简单理解,如果直接使用开源的DS就可以达成不错的效果,那为什么需要再花大钱买卡训练模型?这也是美股英伟达跌的多的原因。

2)DS降本主要还是依靠工程的优化。DS其实技术上没有特别突出的创新,还是依靠工程化的降本比较重要。比如DS的MoE架构是利用了共享专家、均衡函数、MTP机制一次性预测多个token降成本,达成可以接受的效果。但这样的事情是行业的常态,过去的KIMI和Sora其实也大多是基于现有技术的工程优化完成了一步步的进化。我们要知道其实模仿和组合也具备很高的技术含量。本轮最大的原创创新应该是用GRPO免去SFT这个环节,大幅降低了对标注数据的依赖,也增强了推理效果。

3)关于投资的影响,一些想法有待验证:

a. 一是AI平权,是开源对闭源的挑战,可能会抹平OAI和英伟达链的霸权,这也是海外演绎最核心的逻辑

b. 头部厂商的算力投入不会有太大的影响,未来中腰部比如苹果、亚马逊等公司算力投入可能会有所下降。

c. 产业链价值未来会从算力到应用渡让,应用肯定是最重要的方向,但是在应用的选择上要优选有场景定价权的公司。另外就是一些在海外已经基于GPT跑通了的应用公司,关注端侧、ai agent

d. 算力层:降本是核心,产业链最核心的环节是云及配套,其次关注新的推理技术方案+配套供应链,关注asic+aec


逻辑受益和受损的细分赛道:


DeepSeek可发酵/炒作方向:

1、#端侧AI软硬件应用(AI+消费电子、AI+生产力工具等)

2、#Agent

3、#推理算力up(IDC/CSP云厂商、AIDC智算中心、AISC推理芯片、边缘算力/端侧模组等)

4、#AI产业链全国产闭环、中国AI资产+科技资产价值重估!(尚待突破的瓶颈:半导体、底层系统架构等)

5、合作、接入/部署DeepSeek R1等

6、先进技术细节:算法优化、Inference-Scaling

(后训练+推理阶段)、知识蒸馏、强化学习(RL)、MoE、混合精度训练、模型微调、冷启动SFT等


再补充一个纪要:【DeepSeek对算力影响有多大?】


摘要:

DeepSeek带来训练成本下降:相较于GPT、LlaMA,DeepSeek的训练成本下降很多,但实际训练成本并没有想象中550万美元这么低。

业内技术路线影响:国内互联网大厂和“六小虎”可能都会follow DeepSeek的技术路线,但因组织架构差异有难度;国外走独立技术路线的团队优化方案和硬件与DeepSeek不同,未必能达其优化效果。

算力需求前景:①训练算力:DeepSeek 加快迭代,对训练算力需求大,业界仍在抢卡探索。②推理侧算力:DeepSeek R1 自推理模型需求增长,对训练服务器需求上升。③Post-Training 算力:OpenAI 和 DeepSeek 证实路线可行,业界将 follow,算力需求上涨。

AGI 发展:参考 DeepSeek 技术路线或使通往 AGI 路径更简单,但仍需向OpenAI看齐。

幻方在多模态领域仍落后:幻方尽管在大语言模型层面出圈,但在多模态方面落后,技术路线待突破,虽发布三个模型效果一般,过去半年技术路线摇摆。

国产算力影响:近期因DeepSeek爆火,国产算力需求激增,推理算力被大量消耗。后续或将稳定增长,需求回归理性。国产卡发展取决于产品竞争力,此前受国家或地缘政治保护,与英伟达产品仍有差距。

         

 

交流内容:

训练成本下降

整体:训练成本成本毫无疑问下降。(原因:相较于OpenAI GPT、LlaMA,在各家均要经过多轮尝试的前提下,DeepSeek的训练成本下降很多。)

单点:完整训练DeepSeek V3的成本确有下降,但实际训练成本并没有想象中550万美元这么低。(原因:V3经历好几轮的训练和尝试,在真正做预训练的过程当中完全没有论文中说到的这么低。)

         

 

行业影响

国内

发展现状:国内有两种情况:①国内“六小虎”(智谱AI、百川智能、零一万物、月之暗面、Minimax、阶跃星辰)、互联网巨头等作为消耗算力的大户,基本都在follow LlaMA和千问的路线,很少真正走自主研发道路。主要的模型参数量基本都与国外开源模型和Qwen对标(例如:7B、13B、70B等)。②幻方DeepSeek-V3拥有671B个参数,很特别,国外没有一个参数量是这个参数规模的。

后续影响:互联网大厂和“六小虎”可能都会follow其技术路线(包括复现模型参数量等,如果完全按照DeepSeek的路线,模型参数量虽然很大,但是对算力的需求确实没有之前那么高,可能就不像之前需要堆万卡集群才能训练出一个大模型)。    

行业完全follow有难度:互联网大厂这方面的能力相对较弱的(原因:组织架构差异。字节做豆包的是一个团队,做豆包的部署和算力优化又是另外一个团队;幻方因为规模小,非常扁平,就只有那个北京,杭州两base)。所以虽然的算力的消耗降下去了,但实际上你要完全的follow这个技术路线或者它的优化方案是很难的,除非你的模型跟它长得一模一样。

         

 

国外

发展现状:国外一直都是走独立自主的路线(不管是马斯克旗下xAI团队的Grok、OpenAI、Claude、还是Meta、谷歌的Gemini),每一家的模型参数量都是不一样的,几乎没有非常统一的像7B、13B这种国内许多模型涌现的情况。

后续影响:如果走独立自主的技术路线,那么优化方案、硬件等与DeepSeek会有所不同。DeepSeek是因为自身的特殊优化才能将硬件算力消耗做到很低。所以对于走独立技术路线的团队,不一定能够达到这么大的优化效果。

         

 

优化方式

独特的架构:它最重要的是自己独立的新MoE(Mixture of Experts,混合专家)架构,即小模型、多专家的模式(MoE本身就有不同的技术架构,之前大家选择的MoE大多是大模型、小专家的路线)。②独特的优化方式:DeepSeek针对该技术路线,在编译器中间表示层面对算子框架进行了深度融合优化,从而有效提升了算力利用率。(但是其他家真正的在这一方面的投入并不多,基本上也只follow业界进展)。因此认为真正的中间件优化是需要和算法一起联合优化,而不是定了算法再去优化中间件)

         

 

算力需求前景

算力需求骤降的可能性不太大。

训练算力:随着DeepSeek后续的加快迭代,本质上对训练的算力还是需求很大的。幻方本身不缺卡,大家都在抢卡以尽可能的拥有更多的算力,做更多的探索和尝试。

推理侧算力需求上升:从用户方面,DeepSeek R1的这种自推理的模型的需求在增长。DeepSeek所有专家合起来才真正激活的参数量是35B,意味着它的推理方案有大量的冗余的算力,可以用来算大量的算用户的服务请求。一方面,幻方这套方案用300多卡来去做推理,看上去还是很多,但是一方面其也做好准备,承载大量的日活,从而保算力摊薄,所以对训练的服务器的需求也在增长。(这个推理算力跟以前的推理算力不一样,这里面的推理算力更多的是面向训练服务器的推理的算力,而不是推理卡的推理算力的)

Post-Training算力需求上涨:OpenAI和DeepSeek证实了路线可行性,业界因此会follow这条技术路线。

(目前基本沿这三条曲线快速演进)   


AGI发展

参考这条技术路线之后,大家可能通往AGI的路线应该更加简单。但需要参考天花板——OpenAI,如果OpenAI的新的技术路线停滞了,个人觉得大家通往AGI的方向也会停滞(原因:国内外基本上都是OpenAI在牵头,其他人follow),DeepSeek可能可以让大家更快的抄袭或者跟随OpenAI。

         

 

幻方在多模态的表现

整体来说是非常的落后的,它在这方面它有非常多的就是技术路线要去突破的(数据规模、模型规模、数据策略),发布的三个模型的效果都一般。但不妨碍它可能未来基于MoE的架构做多模态(整个业界还没有先例,现在业界都是基于稠密的transformer),过去的半年其在多模态的技术路线是在摇摆的,没有掌握好自己的一个训练的路线。所以说其有好的也有不好的,当下只是关注了它好的一方面。

         

 

国产算力影响

近期激增,后续稳定增长。短期内让更多的算力用起来,在过年期间大家(甚至以前完全没有用AI的人)都开始用它,大量的消耗了这种推理的算力,但未来的算力的需求,肯定是恢复一个理性的状态——真正有需要的人才会去用。现在国内厂商的支持更多的是一个热点的问题,不是一个可持续性的(价格、资源)。

后续国产卡发展仍需要看产品的竞争力。目前只是因为DeepSeek火了,大家连带出圈。国产卡基本上都是依靠国家或者地缘政治的保护下起来的。早在DeepSeek出圈以前,国产卡也一直都能用,只是较英伟达仍有差距。


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek AI应用 港股 云业务 国产算力
相关文章