原创 信息平权 2025-02-06 21:51 越南
1. 李飞飞那个50美金是蒸馏,不代表训练算力。下图形容最贴切。一杯星巴克训个模型咋可能...不过这反倒说明了蒸馏小模型既普遍又便宜,已经成为了一个标准工程工序,蒸馏不丢人。另一方面,我倾向于认为市场慢慢会对一个个爆出来的低训练成本脱敏。逐渐都搞明白了,训练成本是个很宽泛的概念,几万甚至几百美金蒸馏一次也叫训练,顶级实验几十亿美金探索出一条scaling方向也叫训练,能放一起比吗?重点已经不可逆的转向了推理和应用叙事。
2. 大摩出了人形机器人深度,梳理出了全球100家核心公司,其中接近一半都是中国公司。具身智能不仅叙事宏大、炒作久期长、关键国内核心受益公司比大模型多得多。太长了就不贴了,完整版上传了,大家可以自己去看
3. DeepSeek 日活超3000万了,算上了web网页端。咱们文章最早说2000万,但被某个行业大佬挑战了,因为口径问题当时的确可能也就1000万.....但耐不住这泼天流量,每天都在增长啊....严谨点,Mobile和网页目前没什么好办法去重,但影响不大。按照目前增长势头还要继续新高。具体3000万DAU需要多少算力?看到本营有篇测算(2000万+DAU的DS需要部署多少推理算力)大家可以去看(上传了)
4. 我们昨天说了高盛推出了“中国AI一揽子”,今天UBS也推出了“中国AI一揽子”,选取了40多只股票,主要集中于应用、软件、国产芯片、服务器等。总之海外对中国的关注度最近的确提升了,我们最早在1月29提到了是否中国资产值得重估,当时还被很多人嘲笑,结果现在成了海外关注焦点。
5. 今天和台湾朋友聊了聊,大家关心的GB200良率问题有改善但不大,鸿海的确每日都在进步,但美洲工厂教不会...良率还是差。不过随着NV跌到120,这个已经不是核心矛盾了。马上到来的Q4业绩,数字本身的重要性比重降低,反而是DS引发的训练叙事和推理叙事的演绎,大于业绩本身。业绩更重要的是听老黄如何回应。
另外,台湾Fubon出了篇CPO报告,公司列的还挺详细,放在日报了。以及明天的AWS业绩估计Capex还是不错,拭目以待。Capex解读请参考昨天文章,反馈不错。
以上涉及到的所有报告和纪要都已上传,比亚迪智驾的解读和讨论下午已经发贴了,欢迎来探讨。