算力百科 03月07日
智算中心首选96G 4090,将成为Deepseek推理算力新王
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文分析了当前智算中心投资的新趋势,指出随着AI硬件迭代周期缩短,算力投资回收周期应相应调整。推理算力需求远超训练算力,C类算力中心建设加速,而4090凭借其性价比和环境适应性成为推理芯片的首选。文章还深入探讨了24GB、48GB和96GB三种4090型号的特性,并分析了4090在FP8和INT4支持方面的优势。最后,文章揭示了智算中心的三种盈利模式,强调了供需匹配的重要性,并长期看好4090系列显卡的未来。

💡算力投资周期缩短:全球硬件创新加速,AI硬件迭代周期已大幅缩短,建议将算力投资核算周期调整至2.5~3年。

💰推理算力需求激增:C类智算中心建设加速,以4090推理芯片为主,性价比和环境适应能力是关键,无需卡间link。

💻4090芯片优势:4090支持FP8和INT4,性价比高,环境适应性强,适合分布式机房,且成本回收快。同时分析了24GB、48GB和96GB三种型号的特性,以及大厂使用48GB 4090做大模型推理降本增效的案例

📈智算中心盈利模式: 算力模式(价格战红海)、炒股模式(拉升股价或投资AI芯片公司)、跑路模式(项目建设后承诺回租算力时跑路)。

🤝供需匹配至关重要: 算力市场存在供需不匹配问题,类似大学生就业难,关键在于价格是否合适,找到供需平衡点。

原创 算力百科 J 2025-03-07 06:10 贵州

推理芯片的竞争力是性价比和环境适应能力:相当长一段时间内4090芯片需求旺盛,你把A100、H100类的AI高端服务器放在边缘机房里很难适应,但是4090放在边缘机房可以很好的适应。就好比你把跑车放在乡间小路上根本跑不起来。


结论先行:智算中心投资首选4090



    1、算力投资回收周期大幅缩短。全球硬件创新正在加快,所以AI硬件的迭代周期已经大幅缩短,算力投资核算周期应该由原来的4~8年缩短到2.5~3年内核算,相关算力投资财务模型需调整。

    2、推理算力需求远大于训练算力:参考ABC类智算中心划分,推理C类算力中心建设正在加速,但是以48GB/96GB 4090推理芯片为主,性价比和环境适应能力是推理芯片取胜关键。推理不需要卡间link。

    3、推理芯片的竞争力是性价比和环境适应能力:相当长一段时间内4090芯片需求旺盛,把A100、H100类的AI高端服务器放在边缘机房里很难适应,但是4090放在边缘机房可以很好的适应。就好比你把跑车放在乡间小路上根本跑不起来,因为会底盘托底,什么样的环境,配什么样的车。


    以上3个算力行业变化,都预示着4090长久不衰,类似2080ti。


24GB/48GB/96GB的4090



        

    很多人不理解,为什么自己的智算中心的算力突然卖不出去了,弱主体的租赁毁约率突然上升,虽然推理需求井喷,但是很不幸,你的AI算力不具备性价比和环境适应能力。


    跑车厂商并不清楚为啥跑车卖不动了,永远都想不明白且也不愿意放下身段,去让普通消费者消费得起跑车。

    

    24GB 4090:官方推荐版本,注意只有正面2GB*12颗显存粒子,也就是24GB显存(背面是没有显存颗粒的)


 

    48GB 4090:中国厂商生产的 48GB 4090 ,是在背面又加入12颗 2GB显存,变成了 2GB*24GB 48GB (注意背面有12颗粒子)

    


    96GB 4090: 96GB 4090 是在48GB的基础上把2GB*24 改成了4GB*24 。

    非常多的人质疑 96GB 4090显存的存在的真实性。质疑的人是不知道三星GDDR6W 单颗4GB显存颗粒的存在。这颗粒子用的不多,很多同行都不知道。

    GDDR6W是一种特殊的GDDR6颗粒,采用了FOWLP封装,单颗显存的密度和带宽更高,单颗GDDR6W为64bit(GDDR6为32bit)4GB。还是那句话,各自赚认知内的米。



    当然,并不是说有4GB粒子就可以研发成功96GB 4090,AI推理对卡的稳定性要求比较高,96GB能否稳定,还需要看最终测试效果。


    关于48GB 4090 稳定性,其实大家可以放心使用,能改vbios的一定都是xx的代工厂,否则根本没有vbios源代码,靠反编译改vbios,这么大的改动量不可能实现。

    懂的都懂!目前大厂都在用48GB 4090 做大模型推理做C端应用,减低成本。所以很多其他算力和其他卡不太好卖,特别是PCIE的其他N卡。

    

为什么投资推理算力就用4090



    4090(‌RTX 4090显卡的芯片代码是AD102-300‌)是ada 架构跟hopper架构是同一代架构,Blackwell也是延续的这一代改良,4090和6000ada是同一个die 只是筛片不同,但是性价比差3倍。

     4090是支持FP8和INT4的,也就是说下一代deepseek R2如果采用INT4做推理,4090依然是最有性价比的个芯片。很多人质疑4090 对INT4(Q4)的支持,我特地查了英伟达芯片说明书,这个资料很多人没有,我截图给大家。

       推理算力不一定要集中建设,可以分布式建设,分布式机房就面临着脏乱差的局面,比如电压不稳定,空调制冷不达标等等。这样的条件就需要推理服务器特别皮实,高端AI服务器基本上不太可能生成,寿命堪忧,一句话需要AI服务器耐操。

       另外:大模型架构的变化很快,所以基本上2~3年就淘汰一代AI卡,所以成本低,能快速回收现金流是核心。   


        我个人是长期看好4090,特别是48GB 4090和96GB 4090的未来。当然如果64GB或者128GB 5090量产,可能取代4090的地位。目前32G 5090对比48GB 4090是不占优势的。

        


        

算力中心投资的商业模式始终没变





    智算中心赚钱基本上就3种途径:《智算中心赚钱真相(一)》《智算中心不赚钱真相(二)

    1、算力模式:基本上已经是红海,都是在价格战,本质上无法赚到钱。

    2、炒股模式:通过算力业务拉升股价,在资本市场赚钱或者AI芯片公司占股,AI芯片公司IPO后套现。

    3、跑路模式:傻子之间达成共识也能赚钱,只要有人相信,建设项目的钱赚一笔,承诺回租算力的时候跑路即可。

    

    随着Deepseek Manus等AI大模型应用的落地,推理算力需求肯定会呈现爆发性增长,但是为啥你的算力卖不出去?!

    本质上是供需不匹配。这有一个特别明显的例子,就是大学生找工作的供需不匹配。每年那么多大学生毕业找不到工作,但是很多企业又招不到合适的员工,这个跟算力市场是一样的。

   

     我们团队非常认同一句话,没有卖不出去的房子,只是价格不合适;同理,没有卖不出去的算力,只是价格不合适。



    

欢迎加入DS前瞻圈,一起领略Deepseek引领AI文艺复兴!!



阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

智算中心 4090 推理算力 AI芯片 算力投资
相关文章