原创 算力百科 J 2025-03-03 06:00 贵州
算力百科是一个算力和大模型工程专属服务IP。我们是一波IC设计的人员组成的“草台班子”,长期耕耘在国产AI芯片圈,我们自认为,对算力和大模型认知还算可以,我们跟第三方咨询机构最大的区别,就是我们一切以实践出发,站在中立的立场。
感谢各位领导的邀请,也非常荣幸代表算力百科,跟大家交流几个我们技术的观点和看法。
首先介绍一下我们自己,算力百科是一个算力和大模型工程专属服务IP。我们是一波IC设计的人员组成的“草台班子”,长期耕耘在国产AI芯片圈,我们自认为,对算力和大模型认知还算可以,我们跟第三方咨询机构最大的区别,就是我们一切以实践出发,站在中立的立场,表达我们的技术观点,可能会引起一些领导的感官不适,先提前跟大家道个歉,我们仅从技术角度发表观点,IP目前处于孵化阶段。
我主要表达三个观点:
第一个观点:Deepseek 确实让大家重新认识了大模型,并且让从业者感到了民族自豪感,非从业者感观不强。
第二个观点:算力乱象,在座的很多领导决策建设的算力中心可能要掉队,你们心理苦,建议看开点,就当交学费啦。
第三个观点:算力和大模型产业淘汰赛开始,25年26年加速震荡,27年进入相对稳定期,下一个五年计划大发展。
第一个观点:首先,国民认识大模型主要两个契机,一个是22年底GPT朋友圈火了,公众第一次开始知道有大模型这个事,都在喊狼来了。另一个契机是24年底Deepseek朋友圈火了,大家在喊狼真的来了。
我说我的经历,今年从初二开始就跟小伙伴一直在讨论怎么参与到Deepseek浪潮里,DeepSeek是懂咱的,真会找时间发布R1,就是让大家有7天时间充分讨论。
其次,Deepseek 确实在工程化上,进行了大胆创新,并且取得了世界级成果。
为什么他可以创新,而其他大厂不行,这么说吧,大厂都有英伟达现场指导小组,大家使用英伟达显卡都是按照英伟达的官方指导在使用。但是Deepseek因为是小团队创业思维,他们采用不同小组实验的模式,没有遵从指导手册,比如传统大厂都是用cuda上层Api来使用显卡算力,deepseek开创性的使用ptx低层次API来直接驱动显卡,这个策略非常有效,大大提高了显卡的利用率,但是英伟达官方不会这样指导客户使用显卡,因为英伟达希望你显卡利用率低,需要买更多显卡。
如果全球厂商都采用ptx 驱动显卡,一张卡当两张卡用,那需求量就少一倍,这是显卡厂商不愿意看到的,deepseek也挖掘出一些Nv没有公开的指令集方法,也佐证了显卡厂商有意为之。
最后,这是第一次在算力和大模型领域有世界级成果,不是来自西方世界,这个成果来自东方神秘的创新城市杭州,不是北上广深,这更让deepseek蒙上了一层神秘面纱。
大家都习惯了优秀的科技公司来自一线城市,惯性思维也是这么想的,但是deepseek打破了这一常规,让在座的各位领导喜忧参半,一线城市的比较担忧,大领导一直叼咱,为啥咱这里没有出现类似公司,二线城市,特别是新二线城市,大领导一直念叨,看到了希望,咱这个城市是不是也可以出现类似公司。大家的心态在发展变化,特别是城市一把手的心态。
第二个观点:算力乱象,在座的各位管理的城市都建设了不同规模的算力中心,里面有A系列 H系列 RTX系列的N卡,也有各种各样的国产卡,不管选型是什么卡,我想说deepseek短时间给各位领导解套了,至少不会完全空置算力,但是25年甚至26年来看,把大家带入了技术迭代的陷阱,因为deepseek加速了算力中心技术淘汰,2年淘汰一轮卡。
先拿N卡来说,只有Ada和hopper 架构的支持FP8,下一版本FP4,国产卡来说95%,不支持FP8,如果大家认可deepseek给产业带来的机会,那么意味着认同deepseek的技术路线,Fp8和fp4是deepseek走的核心技术路线,但是与在座的各位的智算中心选型不一样,意味着大家建设的绝大多少智算中心不符合deepseek引领的大模型浪潮。
这意味着啥大家能明白不?大家在投资智算中心的时候基本上都有“两案一书”,也许当时是对的,并且上了x委会,但是仅仅过了1~2年“两案一书”过时啦。况且好多投资算力中心回本测算,周期都是按照5年甚至8年核算的,专项债、项目贷、城投、城发等等类似平台公司怎么办?这说明大家血本无归啊,当然如果扶持了算力产业也算是对城市产业的贡献之一,这个学费交的有点多啦,也许让平台公司一蹶不振。
目前,对于算力中心大家基本上有两种心态,规划做了,钱申请了,已经上车了,继续硬着头皮做下去。或者有一批已经蒙了,继续干不行,不干好像也不太行,所以建议大家多向上请示,三思后行,但是整体向好。
第三个观点:deepseek代表的大模型产业肯定是未来核心生产力,在人类社会发展史上,能称之为生产力的不多,畜力是一种,蒸汽机是一种,电力是一种,算力和大模型是一种,成为驱动未来社会的核心要素之一。
我们预测R1和R2的架构变动会相对比较大,R3以后架构趋于稳定,这里有2个技术佐证:
1.通过openinfra的的解读我们发现deepseek已经把hopper架构的潜力挖掘了90%以上的利用率,如果想在进一步提升推理效率,FP4势在必行,预计架构变化依然很大。
2.通过A100和H100,以及H100和B100的架构分析,可以基本发现,H100和B100 架构趋于稳定迭代,说明在目前的半导体材料的现状下,要想持续创新,约束还是比较明显的。
基于以上两个技术佐证和预测,R2和R1变化类似A100和H100,R2和R3变化类似H100和B100的关系。意味着什么呢?
意味着目前大家在智算中心上线的R1,如果R2发布,那么意味着升级的时候怎么办?架构变动过大,升级就不能平滑。
要考虑基础模型升级的平滑性,如果是N卡的hopper或者ada这一代,那么可以平滑升级,也就1~3天内能完成R2到R1的升级。但其他的卡就从R1升级到R2的时间就不一定啦,在座的基本上没有自己升级模型的能力,一边是领导的紧箍咒,一边是厂商的不给力,意味着,当R2发布,领导一声令下要尽快从R1升级到R2,并且快速上线发文宣传,那在座的各位也许会感受到不一样压力和苦楚。
站在技术角度,特别特别理解在座的各位,各位又有多少自主选择的全力呢?!这个就不展开啦。
DeepSeek给国产AI芯片注入了新的活力,让整个产业链重燃激情和战火,这2个月大家都在加班,虽然很累,但是激情澎湃,孜孜不倦。
DeepSeek给大家带来的是民族自豪感,第一次有世界级的成果来自东方的神秘力量,这个力量是他们不知道的。这次爆发的宇宙中心是杭州。
一个产业要想发展,需要有人持续的努力,这种精神是新时代的两弹一星精神,有一批人在默默努力,革命成功指日可待。
还是那个建议:
吃皇粮的就应该扶持产业链,不应该考虑经济回报,建议多多选择国产AI芯片。 市场化的,可以自由根据经济和市场环境需求,选择AI芯片。
we have a dream,如果大家不爱,请不要唱衰国产AI芯!
更多咨询,欢迎加入Deepseek引领的AI时代文艺复兴!