原创 信息平权 2024-12-12 22:18 上海
国产算力尾盘拉升,大家传的最多的是:天猫英伟达旗舰店下架了所有商品。自己去看看就只知道, 还能买。纯造谣。所以尾盘为什么国产算力集体拉?虽然不能过度解读短期波动,但觉得对国产算力的确可以乐观点。
昨天文章详细测算了为什么ZJ明年每日token调用量可以上数十万Token/天。对,又收到反馈了...感谢读者大佬指点。其实不仅仅是我说的各种chatbot、agent等推理场景,甚至各种终端、to B的各类workflow,这种token消耗起来是惊人的,单次调用可能远超C端,且商业化上说不定比C端更容易跑通。这里引述另一位大佬的话,非常前瞻:我们未来会经历一段时间的reasoning token扩展时期,即每半年平均每个回答需要的reasoning token数量会是原来的X倍。
上述总结,算是对昨天文章token增长演算的高度概括。每次调用消耗token提升,代表解决的问题复杂度提升;调用次数提升,代表着解决问题的广度和覆盖度在提升,两个因子合在一起,就是AI对整个生产生活的渗透过程。相比于摩尔定律或者模型进步的scaling law,reasoning token扩展定律可能更能反映应用未来的发展进度。
如果假设这个“经验性+预测性”的定律存在,这些token的增量速度都可以映射为推理算力的增长速度。而过去一段时间我们文章反复强调了几个重点:预训练遇到“soft wall”但模型进步没放缓;NV GB200供给小问题但需求没问题;应用先手,但应用最终会和算力循环驱动;明年算力结构中推理会成为绝对主流。因此ASIC是有机会的,国产算力更是有机会的。对上游来说也是好事,供应商应该乐见客户多样化、非NV需求的提升。比如最近大火的AEC,的确海外ASIC和国产算力(包括9X0C)基本都要走铜+AEC的超节点路线。
之前讲capex的文章“被”删了,大家可以自行理解下。因此明年的需求是确定的。但圣诞节前后,可能会有针对AI芯片的新规则出来,标准可能会接近台积电11月所谓“断供”划的那几条线。这件事不确定性较大,仅供参考。
其他干货长话短说概括下,或者直接去星球看报告,都上传了:
Bernstein的Lin上调了海光和寒武纪预测
核心观点:认为中国AI找到了规避美国封锁的方法,比其他国家更快转向了推理、更快开始商用垂直领域小模型,而GPU出口管制为国产创造了新市场
GB200 2月以后发货
鸿海在GS台湾路演上明确说,“整机柜”GB200发货要在中国农历春节后(2月之后)。之前公司路演口径都是NVL72是24年底发货,这次算不算首次明确改口?有趣的是,专门区分了“整机柜”,说明非机柜的B200不管以哪种形式,会提前出一些。以及我们之前详细解释过NV确认收入比L10这些ODM要早。这可能是NV CFO之前敢说Q1 B收入可能超过H的原因。
真正的苹果AI:ios18.4
昨天说的Toni老师,首次提出25年4月份会发18.4,这和Mark Gurman说的“明年春”接近。这是大家期待的,真正具有“agent”雏形的Apple Intelligence版本,也就是WWDC上苹果秀出的那一堆期货:跨APP操作、订票等助理任务。但Toni老师的意思是18.4不会过于惊艳(毕竟大家预期太高),还需要版本慢慢迭代。意味着iPhone16显然不会是个大cycle,iPhone17才是。这里你就懂了iPhone投资人预期的时间跨度、容忍度,都是奔着iPhone 17 super cycle去的,眼前噪音都不是事儿。
报告都上传星球了,此外华为大佬贡献了刚刚出版的张仲谋自传下册,欢迎领取!