NVIDIA 为中国市场专门设计的 H20 Hopper GPU 近日现身 Geekbench 6,测试结果显示其核心数量比顶级 H100 减少 41%,性能降低 28%。尽管 H20 在核心数量和性能方面有所缩减,但它配备了 96GB HBM3 内存,比原始 H100 的 80GB 更高,同时还拥有 4.0 TB/s 的带宽。H20 预计将在今年交付超过 100 万个芯片,销售额有望超过 120 亿美元,超过上一财年 NVIDIA 的中国区营收。
🤔 **H20 Hopper GPU 核心数量和性能缩减**:H20 Hopper GPU 的核心数量比顶级 H100 减少 41%,性能降低 28%。H20 配备 78 组 SM,而 H100 配备 144 组 SM(部分版本启用 132 或 114 组)。
💪 **H20 Hopper GPU 内存和带宽优势**:尽管性能有所降低,但 H20 仍配备了 96GB 的 HBM3 内存,比原始 H100 的 80GB 更高,但低于新版 H100 的 144GB HBM3E 内存。H20 的带宽为 4.0 TB/s,低于顶级 H100 的 8.0 TB/s。
💰 **H20 Hopper GPU 销售潜力巨大**:芯片行业咨询公司 SemiAnalysis 预测,NVIDIA 有望在当前财年交付超过 100 万个 H20 芯片,预计每个芯片售价在 1.2 万至 1.3 万美元之间。这意味着 H20 芯片的销售额有望超过 120 亿美元,超过上一财年 NVIDIA 的中国区营收。
🚀 **H20 Hopper GPU 性能表现**:在 Geekbench 6 测试中,H20 的 INT8 为 296 TFLOPS,FP16 为 148 TFLOPS,TF32 为 74 TFLOPS,FP32 为 44 TFLOPS,FP64 为 1 TFLOPS。OpenCL 测试中,H20 得分 248992 分,而 H100 80GB 版本得分约为 280000 分,启用 132 组 SM 的 H100 则可达 350000 分。
💡 **H20 Hopper GPU 其他功能**:H20 还配有 60MB 的 L2 缓存,支持 7 个多实例 GPU,8 路 HGX 配置,900 GB/s 的 NVLink 带宽,TDP 为 400W。
快科技7月10日消息,面对美国出口限制,NVIDIA专为中国市场设计了符合规定的H20 Hopper GPU,不过和全球热卖的H100之间有多大差异,NVIDIA一直都没有透露。
不过近日H20现身Geekbench 6,显示其核心数量比顶级H100减少41%,性能降低28%。根据Geekbench 6测试数据,H20配备78组SM,而H100 GPU总共配备144组SM,不过并没有全部打开,其中SXM5版本中启用了132组SM,而PCIe 5.0版本则启用了114组SM。此外,H20配备了96GB的HBM3内存,比原始H100的80GB要高,但低于新版H100的144GB HBM3E内存;同时H20的带宽为4.0 TB/s,低于顶级H100的8.0 TB/s性能方面,NVIDIA H20的INT8为296 TFLOPS,FP16为148 TFLOPS,TF32为74 TFLOPS,FP32为44 TFLOPS,而FP64只有1 TFLOPS。
在OpenCL测试中,H20的成绩为248992分,H100 80GB版本大概在280000分,如果是拥有132组SM的H100可达350000分左右,配备了144GB HBM3E的H100分数就更高了。其他方面,H20还配有60MB的L2缓存,支持7个多实例GPU,8路HGX配置,900 GB/s的NVLink带宽,TDP为400W。根据芯片行业咨询公司SemiAnalysis的预测,NVIDIA有望在当前财年交付超过100万个H20芯片,预计每个芯片售价在1.2万至1.3万美元之间。也就意味着H20芯片预估今年销售额将超过120亿美元(约合870亿元人民币),有望超过上一财年NVIDIA的中国区营收。
【本文结束】如需转载请务必注明出处:快科技责任编辑:黑白文章内容举报]article_adlist-->