信息平权 01月06日
为什么尾盘拉升?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章提及国产算力尾盘拉升,探讨了token增长演算、算力发展等内容。包括算力增长与token增量的关系,ASIC及国产算力的机会,以及一些相关产品的信息和预测。

💻国产算力尾盘拉升,虽不能过度解读短期波动,但可乐观对待

🔢token增长演算高度概括,调用消耗token和次数提升反映AI渗透过程

🎯ASIC有机会,国产算力更有机会,明年算力结构中推理将成主流

📅一些产品的发货时间、预测及相关信息

原创 信息平权 2024-12-12 22:18 上海

国产算力尾盘拉升,大家传的最多的是:天猫英伟达旗舰店下架了所有商品。自己去看看就只知道, 还能买。纯造谣。所以尾盘为什么国产算力集体拉?虽然不能过度解读短期波动,但觉得对国产算力的确可以乐观点。

昨天文章详细测算了为什么ZJ明年每日token调用量可以上数十万Token/天。对,又收到反馈了...感谢读者大佬指点。其实不仅仅是我说的各种chatbot、agent等推理场景,甚至各种终端、to B的各类workflow,这种token消耗起来是惊人的,单次调用可能远超C端,且商业化上说不定比C端更容易跑通这里引述另一位大佬的话,非常前瞻:我们未来会经历一段时间的reasoning token扩展时期,即每半年平均每个回答需要的reasoning token数量会是原来的X倍。

上述总结,算是对昨天文章token增长演算的高度概括。每次调用消耗token提升,代表解决的问题复杂度提升;调用次数提升,代表着解决问题的广度和覆盖度在提升,两个因子合在一起,就是AI对整个生产生活的渗透过程。相比于摩尔定律或者模型进步的scaling law,reasoning token扩展定律可能更能反映应用未来的发展进度。

如果假设这个“经验性+预测性”的定律存在,这些token的增量速度都可以映射为推理算力的增长速度。而过去一段时间我们文章反复强调了几个重点:预训练遇到“soft wall”但模型进步没放缓;NV GB200供给小问题但需求没问题;应用先手,但应用最终会和算力循环驱动;明年算力结构中推理会成为绝对主流。因此ASIC是有机会的,国产算力更是有机会的。对上游来说也是好事,供应商应该乐见客户多样化、非NV需求的提升。比如最近大火的AEC,的确海外ASIC和国产算力(包括9X0C)基本都要走铜+AEC的超节点路线。

之前讲capex的文章“被”删了,大家可以自行理解下。因此明年的需求是确定的。但圣诞节前后,可能会有针对AI芯片的新规则出来,标准可能会接近台积电11月所谓“断供”划的那几条线这件事不确定性较大,仅供参考。


其他干货长话短说概括下,或者直接去星球看报告,都上传了:

Bernstein的Lin上调了海光和寒武纪预测

核心观点:认为中国AI找到了规避美国封锁的方法,比其他国家更快转向了推理、更快开始商用垂直领域小模型,而GPU出口管制为国产创造了新市场

GB200 2月以后发货

鸿海在GS台湾路演上明确说,“整机柜”GB200发货要在中国农历春节后(2月之后)。之前公司路演口径都是NVL72是24年底发货,这次算不算首次明确改口?有趣的是,专门区分了“整机柜”,说明非机柜的B200不管以哪种形式,会提前出一些。以及我们之前详细解释过NV确认收入比L10这些ODM要早。这可能是NV CFO之前敢说Q1 B收入可能超过H的原因。

真正的苹果AI:ios18.4

昨天说的Toni老师,首次提出25年4月份会发18.4,这和Mark Gurman说的“明年春”接近。这是大家期待的,真正具有“agent”雏形的Apple Intelligence版本,也就是WWDC上苹果秀出的那一堆期货:跨APP操作、订票等助理任务。但Toni老师的意思是18.4不会过于惊艳(毕竟大家预期太高),还需要版本慢慢迭代。意味着iPhone16显然不会是个大cycle,iPhone17才是。这里你就懂了iPhone投资人预期的时间跨度、容忍度,都是奔着iPhone 17 super cycle去的,眼前噪音都不是事儿。


报告都上传星球了,此外华为大佬贡献了刚刚出版的张仲谋自传下册,欢迎领取!

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

国产算力 token增长 ASIC 产品信息
相关文章