简单几条

原创信息平权 2025-02-06 21:51 越南

1. 李飞飞那个50美金是蒸馏，不代表训练算力。下图形容最贴切。一杯星巴克训个模型咋可能...不过这反倒说明了蒸馏小模型既普遍又便宜，已经成为了一个标准工程工序，蒸馏不丢人。另一方面，我倾向于认为市场慢慢会对一个个爆出来的低训练成本脱敏。逐渐都搞明白了，训练成本是个很宽泛的概念，几万甚至几百美金蒸馏一次也叫训练，顶级实验几十亿美金探索出一条scaling方向也叫训练，能放一起比吗？重点已经不可逆的转向了推理和应用叙事。

2. 大摩出了人形机器人深度，梳理出了全球100家核心公司，其中接近一半都是中国公司。具身智能不仅叙事宏大、炒作久期长、关键国内核心受益公司比大模型多得多。太长了就不贴了，完整版上传了，大家可以自己去看

3. DeepSeek 日活超3000万了，算上了web网页端。咱们文章最早说2000万，但被某个行业大佬挑战了，因为口径问题当时的确可能也就1000万.....但耐不住这泼天流量，每天都在增长啊....严谨点，Mobile和网页目前没什么好办法去重，但影响不大。按照目前增长势头还要继续新高。具体3000万DAU需要多少算力?看到本营有篇测算(2000万+DAU的DS需要部署多少推理算力）大家可以去看（上传了）

4. 我们昨天说了高盛推出了“中国AI一揽子”，今天UBS也推出了“中国AI一揽子”，选取了40多只股票，主要集中于应用、软件、国产芯片、服务器等。总之海外对中国的关注度最近的确提升了，我们最早在1月29提到了是否中国资产值得重估，当时还被很多人嘲笑，结果现在成了海外关注焦点。

5. 今天和台湾朋友聊了聊，大家关心的GB200良率问题有改善但不大，鸿海的确每日都在进步，但美洲工厂教不会...良率还是差。不过随着NV跌到120，这个已经不是核心矛盾了。马上到来的Q4业绩，数字本身的重要性比重降低，反而是DS引发的训练叙事和推理叙事的演绎，大于业绩本身。业绩更重要的是听老黄如何回应。

另外，台湾Fubon出了篇CPO报告，公司列的还挺详细，放在日报了。以及明天的AWS业绩估计Capex还是不错，拭目以待。Capex解读请参考昨天文章，反馈不错。

以上涉及到的所有报告和纪要都已上传，比亚迪智驾的解读和讨论下午已经发贴了，欢迎来探讨。

阅读原文

跳转微信打开

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签