智算中心首选96G 4090，将成为Deepseek推理算力新王

原创算力百科 J 2025-03-07 06:10 贵州

推理芯片的竞争力是性价比和环境适应能力：相当长一段时间内4090芯片需求旺盛，你把A100、H100类的AI高端服务器放在边缘机房里很难适应，但是4090放在边缘机房可以很好的适应。就好比你把跑车放在乡间小路上根本跑不起来。

结论先行：智算中心投资首选4090

1、算力投资回收周期大幅缩短。全球硬件创新正在加快，所以AI硬件的迭代周期已经大幅缩短，算力投资核算周期应该由原来的4~8年缩短到2.5~3年内核算，相关算力投资财务模型需调整。

2、推理算力需求远大于训练算力：参考ABC类智算中心划分，推理C类算力中心建设正在加速，但是以48GB/96GB 4090推理芯片为主，性价比和环境适应能力是推理芯片取胜关键。推理不需要卡间link。

3、推理芯片的竞争力是性价比和环境适应能力：相当长一段时间内4090芯片需求旺盛，把A100、H100类的AI高端服务器放在边缘机房里很难适应，但是4090放在边缘机房可以很好的适应。就好比你把跑车放在乡间小路上根本跑不起来，因为会底盘托底，什么样的环境，配什么样的车。

以上3个算力行业变化，都预示着4090长久不衰，类似2080ti。

24GB/48GB/96GB的4090

很多人不理解，为什么自己的智算中心的算力突然卖不出去了，弱主体的租赁毁约率突然上升，虽然推理需求井喷，但是很不幸，你的AI算力不具备性价比和环境适应能力。

跑车厂商并不清楚为啥跑车卖不动了，永远都想不明白且也不愿意放下身段，去让普通消费者消费得起跑车。

24GB 4090：官方推荐版本，注意只有正面2GB*12颗显存粒子，也就是24GB显存（背面是没有显存颗粒的）

48GB 4090：中国厂商生产的 48GB 4090 ，是在背面又加入12颗 2GB显存，变成了 2GB*24GB 48GB （注意背面有12颗粒子）

96GB 4090： 96GB 4090 是在48GB的基础上把2GB*24 改成了4GB*24 。

非常多的人质疑 96GB 4090显存的存在的真实性。质疑的人是不知道三星GDDR6W 单颗4GB显存颗粒的存在。这颗粒子用的不多，很多同行都不知道。

GDDR6W是一种特殊的GDDR6颗粒，采用了FOWLP封装，单颗显存的密度和带宽更高，单颗GDDR6W为64bit（GDDR6为32bit）4GB。还是那句话，各自赚认知内的米。

当然，并不是说有4GB粒子就可以研发成功96GB 4090，AI推理对卡的稳定性要求比较高，96GB能否稳定，还需要看最终测试效果。

关于48GB 4090 稳定性，其实大家可以放心使用，能改vbios的一定都是xx的代工厂，否则根本没有vbios源代码，靠反编译改vbios，这么大的改动量不可能实现。

懂的都懂！目前大厂都在用48GB 4090 做大模型推理做C端应用，减低成本。所以很多其他算力和其他卡不太好卖，特别是PCIE的其他N卡。

为什么投资推理算力就用4090

4090（‌RTX 4090显卡的芯片代码是AD102-300‌）是ada 架构跟hopper架构是同一代架构，Blackwell也是延续的这一代改良，4090和6000ada是同一个die 只是筛片不同，但是性价比差3倍。

4090是支持FP8和INT4的，也就是说下一代deepseek R2如果采用INT4做推理，4090依然是最有性价比的个芯片。很多人质疑4090 对INT4（Q4）的支持，我特地查了英伟达芯片说明书，这个资料很多人没有，我截图给大家。

推理算力不一定要集中建设，可以分布式建设，分布式机房就面临着脏乱差的局面，比如电压不稳定，空调制冷不达标等等。这样的条件就需要推理服务器特别皮实，高端AI服务器基本上不太可能生成，寿命堪忧，一句话需要AI服务器耐操。

另外：大模型架构的变化很快，所以基本上2~3年就淘汰一代AI卡，所以成本低，能快速回收现金流是核心。

我个人是长期看好4090，特别是48GB 4090和96GB 4090的未来。当然如果64GB或者128GB 5090量产，可能取代4090的地位。目前32G 5090对比48GB 4090是不占优势的。

算力中心投资的商业模式始终没变

1、算力模式：基本上已经是红海，都是在价格战，本质上无法赚到钱。

2、炒股模式：通过算力业务拉升股价，在资本市场赚钱或者AI芯片公司占股，AI芯片公司IPO后套现。

3、跑路模式：傻子之间达成共识也能赚钱，只要有人相信，建设项目的钱赚一笔，承诺回租算力的时候跑路即可。

随着Deepseek Manus等AI大模型应用的落地，推理算力需求肯定会呈现爆发性增长，但是为啥你的算力卖不出去？！

本质上是供需不匹配。这有一个特别明显的例子，就是大学生找工作的供需不匹配。每年那么多大学生毕业找不到工作，但是很多企业又招不到合适的员工，这个跟算力市场是一样的。

我们团队非常认同一句话，没有卖不出去的房子，只是价格不合适；同理，没有卖不出去的算力，只是价格不合适。

欢迎加入DS前瞻圈，一起领略Deepseek引领AI文艺复兴！！

Fish AI Reader