原创 信息平权 2025-02-04 22:51 越南
DeepSeek研究员今天推特上的发言,估计都看到了,总结就是一句话:RL Scaling仍处于早期阶段,R1-zero的curve曲线甚至在春节期间仍在持续提升。说的可能就是r1论文中这张图(如下),随着RL steps提升,响应长度非常优美且稳定的提高,其实就是test-time compute scaling,RL训练越多、模型“思考”时间越长、推理能力持续稳定提高。目前大家最关心的就是这张图或curve曲线的斜率何时放缓,今天DS研究员的发言代表了r1所处阶段看到的斜率,虽然不知道OpenAI和Anthropic实验室看到了哪一步(毕竟他们提前了3-6个月,且用了更多卡去尝试),但至少可以判断的是,开源的模型水平依然还有很大进步空间,对下游依然是正面意义。
此外,春节期间的美股季报,DeepSeek成了必问的问题。尤其是今天Palantir会上管理层的评价,就不贴了一言难尽,大家自己去看,星球大家讨论也挺激烈。同时,政客找到了非常好的理由展开行动。就在这两天,两个比较资深的议员给即将担任国务卿的Rubio写信,中美两边很多律师朋友估计都看到了,我也看到了原文。核心如下:
虽然英伟达甲骨文等极力游说特朗普政府,但AI扩散条例不能被削弱,且应该被加强
H20和等效芯片应该被禁运。
更加严厉得打击芯片走私。
将CX列入清单(对方认为CX在先进内存工艺上取得了突破,进而未来可以制造HBM)
AMD和国内某家相关公司...
说实话这些都是之前能想到的,只不过DeepSeek的出现,让之前可能出现的游说和削弱失去了政治根基。估计这一锤早晚要来。具体H20被禁的影响之前分析过了。国内算力早已“大锅乱炖”,对大厂批量合规上线有影响,但不致命。尤其是最近大家都看到了昇腾为首的国内算力链条集体主动适配r1,核心就在于,以前适配工作量超级大,现在能用了...这句话的分量和意义相当大。
总之,依然将这次DS开源的突破看作一次国运级的事件。不是本身的技术突破有多大,而是关于信心(过去四五年,我们可能最缺的就是信心了...)美国人破防的对立面,是中国人发现那道墙好像也没有高不可及...再仔细捋一捋,发现中国的电力优势、工程降本优势,甚至算法人才资源也不见得差很远。而r1唤起了产业链热情、拉动了国内存量算力、且实实在在推动了下游应用开发。
从股票上看,恒生科技提前开门红了(毕竟南下资金没上班...)著名的高盛AI“一揽子”股票指数,今天也正式推出了GS HK Listed AI Beneficiaries ,理由也是Deepseek之后增加对中国AI的关注,同时将上一波Capex基建叙事下的亚洲最大赢家——台积电和海力士,从"确信名单"(Conviction List)中剔除。是否正确暂不评论(本人依旧看好台积电),但代表了目前资金层面的一些风向。
总之,之前恒生科技开门红我们预测对了,明天希望也有一个A股的AI开门红
(假期期间所有外资行的重要报告,会出几篇完整总结)