算力百科 前天 09:40
智算中心新宠:RTX5090涡轮版,1000P/1个亿/48月回本!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文探讨了智算中心5090推理算力的性价比优势,并对未来的GB10方案进行了展望。文章分析了5090的算力参数和单价,对比了8卡和16卡机型的成本,并给出了租赁价格的估算。此外,文章还强调了FP8在算力中心中的重要性,以及地方补贴对运营成本的影响。最后,文章建议关注尚未量产的GB10方案,认为其量产后有望进一步降低推理算力市场单价。

💡5090算力参数:单卡FP16算力为419T,功耗3.3w,目前已量产,但供应可能受市场波动影响。

💰8卡机型成本分析:单机算力3352T(3.35P),设备成本35w,总成本(含网络设备)1.15亿,支持fp4和fp8。租赁价格0.73w/月/台(0.22w/月/P)。

💰16卡机型成本分析:单机算力6702T(6.7P),设备成本60w,总成本(含网络设备)1个亿,支持fp4和fp8。租赁价格1.25w/月/台(0.19w/月/P)。

⚡️FP8的重要性:FP8已成为新一代算力中心标配,如阿里Qwen3全系标配BF16和FP8。

💡GB10方案展望:建议关注GB10方案,若量产,预计推理算力市场单价将进一步降低。

原创 算力百科 J 2025-05-13 06:01 贵州

智算中心推理算力5090 还是有性价比优势的,建议大家关注GB10方案,目前还没有量产,如果GB10方案量产,预计推理算力市场单价会进一步降低。

    5090 我轮班 单卡FP16是419T算力,单卡3.3w,目前刚量产,缺货随市场波动。
    这里以算力中心FP16 稠密算力为单位进行单价核算:
    8卡机型:单机3352T=3.35P算力,目前一台35w,1000P, 1.05亿算力设备,加10%网络设备,1.15亿 1000P 裸金属推理算力,支持fp4,fp8;
    16卡机型:单机6702T=6.7P算力,目前一台60w,1000P,算力设备9000w,加10%网络设备,1个亿 1000P裸金属推理算力,支持fp4和fp8;
FP8默认成为新一代算力中心标配,阿里Qwen3全系标配BF16和FP8;

    租赁价格,采用互联公司通用分摊定价规则,假设48个月分摊:
    推理算力: 租赁价格,8卡机型,0.73w/月/台(0.22w/月/P);
    推理算力: 租赁价格,16卡机型,1.25w/月/台(0.19w/月/P);
    机房和电费采用运营商和地方补贴方案:近乎0成本
    综上所说:智算中心推理算力5090 还是有性价比优势的,建议大家关注GB10方案,目前还没有量产,如果GB10方案量产,预计推理算力市场单价会进一步降低。《GB10携手nvlink,针对推理市场!又小,又强,又便宜!



GraphicsCard

GeForceRTX 5090

GPU Codename

GB202

GPU Architecture

NVIDIA Blackwell

GPCs

11

TPCs

85

SMs

170

CUDA Cores/ SM

128

CUDA Cores/ GPU

21760

TensorCores/ SM

4(5thGen)

TensorCores/ GPU

680(5thGen)

GPU BoostClock(MHz)

2407

RT Cores

170(4thGen)

RT TFLOPS

317.5

PeakFP32 TFLOPs(non-Tensor).

104.8

PeakFP16 TFLOPs(non-Tensor).

104.8

PeakBF16 TFLOPs(non-Tensor).

104.8

PeakINT32 TOPs(non-Tensor)..

104.8

RT TFLOPS

317.5

PeakFP4 TensorTFLOPS

withFP32 Accumultate(FP4 AI TOPS)

1676 / 3352 .

PeakFP8 TensorTFLOPS 

withFP16 Accumulate.

838/ 1676.

PeakFP8 TensorTFLOPS 

withFP32 Accumulate.

419/ 838.

PeakFP16 TensorTFLOPS 

withFP16Accumulate.

419/ 838.

PeakFP16 TensorTFLOPS 

withFP32Accumulate.

209.5/ 419.

PeakBF16 TensorTFLOPS 

withFP32Accumulate.

209.5/ 419.

PeakTF32 TensorTFLOPS.

104.8/ 209.5.

PeakINT8 TensorTOPS.

838/1676.

FrameBufferMemorySizeandType

32GB GDDR7

MemoryInterface

512Bit

MemoryClock(DateRate)

28Gbps

MemoryBandwidth

1792GB / sec

ROPs

176

PixelFill-rate(Gigapixels/sec)

423.6

TextureUnits

680


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

5090 GB10 推理算力 性价比 FP8
相关文章