IT之家 02月01日
回归 Pascal:英伟达 RTX 50 显卡全部 CUDA 核心支持 FP32 / INT32 双功能
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

英伟达公布Blackwell GPU架构白皮书,披露RTX 50系列显卡技术细节。该架构全部单精度CUDA核心同时支持FP32/INT32数据,此设计回归Pascal架构。文中还对比了各代架构的特点及差异。

🦘Blackwell架构全部单精度CUDA核心同时支持FP32/INT32数据,回归Pascal架构

🐱英伟达在不同世代架构的CUDA核心设计有所不同,如Volta和Turing等

🐶Blackwell架构统一CUDA使每SM的INT32整数运算能力较Ada翻倍

🐹Blackwell SM为神经着色器设计和优化,Ada架构SM为标准着色器设计和优化

IT之家 2 月 1 日消息,英伟达现已公布 Blackwell GPU 架构白皮书,披露了 GeForce RTX 50 系列显卡的大量技术细节,其中相当值得注意的一点是 Blackwell 架构的全部单精度 CUDA 核心同时支持 FP32 / INT32 数据,这点上回归了九年前的 Pascal 架构。

▲ Blackwell 架构 SM 设计

▲ Pascal 架构 SM 设计

英伟达在 GeForce 10 "Pascal" 世代仍采用单精度 CUDA 单元兼顾 FP32 / INT32 的设计,而在 Volta 和 Turing 两代上换用了两组 1:1 比例的 CUDA 核心分别承担 INT32 和 FP32 的方案

▲ Volta(左)、Turing(右)两代架构 SM 设计

来到 Ampere 架构,英伟达则为每个 SM 流式处理器的四个处理块(IT之家注:Processing Block)之一提供了 1 组 16 个 FP32 / INT32 单元和 1 组 16 个纯 FP32 单元;而在 Ada GPU 上,这一设计得到延续。

▲ Ampere(左)、Ada(右)两代架构 SM 设计

Blackwell 架构上的统一 CUDA 使得每 SM 可能的 INT32 整数运算能力较 Ada 翻倍。不过在任何给定的时钟周期内,Blackwell 统一内核只能以 FP32 或 INT32 模式中的一种运行。

英伟达提到,Ada 架构 SM 是为标准着色器设计和优化的,而 Blackwell SM 则是为神经着色器设计和优化的

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

英伟达 Blackwell GPU架构 CUDA核心 技术细节
相关文章