他来了,他来了,今天,老黄穿着崭新的夹克出场了。
刚刚的CES大会上,老黄宣布RTX 5090正式发布。
50系列GPU,价格如下——
RTX 5090:1999美元 / RTX 5090 D:16499元
RTX 5080:999美元 / 8299元
RTX 5070 Ti:749美元

RTX 5090系列和RTX 5080将于1月30日上市,RTX 5070 Ti和RTX 5070将于2月上市,RTX 50系列笔记本电脑将于3月推出
紧接着,老黄以一个别致的「美国队长」造型赢得全场喝彩,并揭秘了全新的数据中心超级芯片——Grace Blackwell NVLink72。
它配备了72个Blackwell GPU、1.4 exaFLOPS算力和130万亿个晶体管,目标是超越世界最快超算。
随后,全球首款真正意义上的桌面超算——Project Digits震撼登场。
这款全球最小AI超算,售价仅3000美金。
有了它,200B大模型在办公桌上就能跑了。
也就是说,它只占用你桌面一个咖啡杯的体积,却能提供数据中心级的算力!
搭载全新GB10 Grace Blackwell超级芯片的Project Digits,能在FP4计算精度下,提供高达1 PFLOPS的性能。
老黄预言:在未来,每个数据科学家、研究者和学生的桌子上,都会有一台Project Digits这样的个人AI超算。
AI时代,将属于每一个人。
RTX 5090首秀,DLSS 4也来了
经过数月的泄密和小道消息,全新一代的RTX Blackwell GPU终于正式亮相了。
首先来看一波性能参数:
920亿个晶体管
4000 TOPS的AI算力
380 TFLOPS的光追算力
125 TFLOPS的着色器算力
32GB的GDDR7显存
1792GB/秒的内存带宽
值得注意的是,RTX 5090 D的AI算力只有2375 TOPS。
不过,虽然比满血版的5090少了一半,但至少比4090 D高了一倍。
如此豪华的配置,再加上DLSS 4和Blackwell架构的加持,RTX 5090的性能直接达到了RTX 4090的两倍之多。
然而,这也意味着它的功耗会很高,(RTX 5090的总显卡功耗为575瓦特,推荐电源供应器功率为1000瓦特)。
demo显示,在RTX 5090上运行《赛博朋克2077》时,启用DLSS 4后达到了238帧每秒,而在RTX 4090上启用DLSS 3.5时,只有106帧每秒。





左右滑动查看


你们都在期待RTX 5090的发布,关注它的规格参数,但你们是否真正理解黄仁勋关于图形技术的说法? 新显卡使用神经网络来生成游戏中90%以上的像素! 传统的光线追踪算法只渲染约10%的内容,相当于一个「粗略的草图」,然后由生成式模型实时地在一次前向传递中填充其余的细节。 女士们先生们,AI就是新一代的图形技术。
第三个scaling law是测试时计算








桌面级AI超算,可跑4050亿LLM
CES大会收尾前,老黄还揭开了一款革命性的压轴产品——Project Digits,一台真正意义上「桌面超级计算机」! 它专为AI开发者、数据科学家、学生等,那些从事AI工作的专业人士而设计。 
这款小型计算机是「全球最小」可运行200B参数模型的AI超级计算机,售价3000美金(约21986元)。 正如老黄所展示的那样,这款紧凑型台式系统提供强大算力的同时,仅占用了极小的桌面空间—— 宽度大约相当于一个普通咖啡杯的长度,高度也仅有其一半左右。 想象一下,你的办公桌上放置一个微型设备,却能提供堪比数据中心级算力。 这就是Project Digits带来的革命性突破! Project Digits搭载了全新的GB10 Grace Blackwell超级芯片,能在FP4计算精度下,提供高达1 PFLOPS(千万亿次浮点运算/秒)的AI性能。 
这颗强大的芯片,还搭载了20个ARM核心的Grace CPU。CPU和GPU通过NVIDIA NVLink C2C技术实现高速互联。 每个Project Digits都配有128GB低功耗统一的高一致性内存,以及最高4TB的NVME存储。 有了它,开发者可以直接在桌面上,运行高达2000亿的大模型。 令人惊喜的是,通过ConnectX网络芯片,可以将2台Project Digits超级计算机互联,能够运行高达4050亿参数的模型。 
此外,Project Digits预装了NVIDIA DGX基础操作系统(基于Ubuntu Linux)和NVIDIA AI软件栈,为开发者提供了一个开箱即用的AI开发环境。 开发者可以即插即用,快速启动AI项目的开发。 对于数百万开发者来说,它将成为一款改变游戏规则的创新产品。 尤其是,Project Digits特别适合处理,需要依赖云计算/数据中心资源才能运行的AI大模型。 这款桌面AI超算应用场景非常广泛,AI模型实验和原型开发、AI模型微调和推理(用于模型测试或评估),以及本地AI推理服务(如聊天机器人或代码智能助手)。 此外,数据科学家还以利用系统运行NVIDIA RAPIDS,直接在桌面就能高效处理大规模数据科学工作流。 
有了英伟达AI完整技术栈的加持(框架、工具、API),Project Digits成为了边缘计算应用的理想开发平台,特别适用于机器人技术、VLM等领域。 Project Digits的出世,标志着个人AI计算进入了一个全新的时代。 它能让全世界开发者能够在自己的办公桌上,运行超大规模的AI模型,补充了现有的云计算资源,极大地提升了AI开发效率。 物理AI新纪元,世界基础模型全开源




物理AI新纪元,世界基础模型全开源
智能体AI之后,老黄又将话题引到了「物理AI」。在他看来,「AI的下一个前沿就是物理AI」。 大模型的工作原理是,根据提示一次生成一个token产生输出。 如果这个上下文变成了现实周围环境,如果提示问题变成了请求,大模型需要从生成「内容token」转变为生成「动作token」。 而现在,我们需要做的是创建有效的「世界模型」,而不再是GPT系语言模型。 
这个「世界模型」必须理解世界的语言,必须理解物理动力学,比如重力、摩擦,必须理解几何和空间关系,理解因果关系,理解物理永恒性...... CES现场,老黄官宣了革命性世界基础模型开发平台——Cosmos,旨在理解物理世界。 它基于2000万小时数据集完成训练,能够将文本、图像、视频作为输入,可以生成虚拟世界状态、视频。 该平台包含多个功能模块,比如扩散模型、自回归模型、视频分词器,开发者可以根据具体需求选择使用。 值得一提的是,老黄现场直接将Cosoms全部开源,Nano、Super、Ultra全部公开可下载。 
此外,Cosoms还能与Omniverse两者结合使用,能够提供一个物理真实的多元生成器。 也就意味着,物理模拟世界的一切,都可以通过Cosoms一次性生成出来。 
老黄还提到了三台计算机——一台DGX用来训练AI,另一台AGX用来部署AI,最后一台便是Omniverse+Cosmos。 若是连接前两者,我们就需要一个数字孪生。 老黄认为,「未来,每一个工厂都有数字孪生,你可以将Omniverse 和Cosoms结合,生成一大堆未来场景」。 
左右滑动查看
自动驾驶汽车+机器人
制造自动驾驶汽车,就像机器人一样,同样需要这三台计算机。 截至目前,每年生产1亿辆车,全球有数十亿辆车,都将在未来逐步变成高度自动化、完全自动化驾驶系统。 老黄预测道,这将会成为首个价值数万亿美金的机器人产业。 同时,他发布了下一代汽车处理器——Thor,处理性能比上一代Orin飙升20倍,而且也是通用机器人处理器。 

那么,在自动驾驶背景下,Omniverse+Cosoms能做什么? 它能够生成无限驾驶场景,加速短尾、无法收集数据等场景的自动驾驶的研发。 
接下来,老黄召唤出所有机器人登台,并表示「通用机器人的chatGPT时刻到来」。 他称,「目前有三种机器人——智能体AI、自动驾驶汽车、机器。如果我们拥有解决这三个问题技术,机器人时代就在眼前」。 在发布会最后的最后,老黄总结道,我们现在共有三台全新Blackwell系统正在生产中。 除了Grace Blackwell NVLink72超算,还有一个是物理AI基础模型,另一个是在智能体AI上研发的三类机器人。 
而就在刚刚,英伟达股价再次创下历史新高。 一夜间,英伟达股价大涨超3%,以每股超150美元的价格收盘,超过11月创下的每股148.88历史最高收盘纪录。 现在,如今,英伟达的最新估值已经达到了3.66万亿美元。 
参考资料: https://www.youtube.com/watch?v=k82RwXqZHY8
一起“点赞”三连↓








左右滑动查看
自动驾驶汽车+机器人






内容中包含的图片若涉及版权问题,请及时与我们联系删除