虎嗅 01月07日
老黄重磅发布RTX5090,定价15000
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

英伟达在CES上发布了多款重磅产品,包括新一代GPU RTX 5090、NVLink72互联技术,以及全球最小的个人AI超算Project Digits。Project Digits搭载Grace Blackwell超级芯片,可在本地运行大模型,并无缝部署到云端。此外,英伟达还开源了商用基础模型Cosmos,并推出了适用于RTX AI PC的NIM微服务和AI蓝图,旨在推动AI技术在各领域的应用。这些创新举措标志着AI PC时代的到来,英伟达也在不断巩固其在人工智能领域的领先地位。

🚀 **RTX 5090 GPU与NVLink72互联技术**:英伟达发布了基于Blackwell架构的RTX 5090 GPU,具备1.8 TB/s的内存带宽和125 Shader TFLOPS的着色器性能。同时,NVLink72技术提供1.4 ExaFLOPS FP4计算能力,以及1.2PB/s的带宽,为高性能计算提供强大支持。

💻 **Project Digits个人AI超算**:这款全球最小的个人AI超级计算机,搭载GB10超级芯片,可以在办公桌上运行2000亿参数的大模型。它配备128GB统一内存和高达4TB的存储,支持本地模型开发和云端部署。Project Digits将于今年5月上市,起售价3000美元。

🤖 **Cosmos开源基础模型**:英伟达开源了Cosmos世界基础模型,该模型在2000万小时的驾驶和机器人视频数据上训练而成,可加速自动驾驶和下一代机器人研发。开发者可利用Cosmos生成合成数据,或进行模型微调,并可通过API目录和NGC目录下载使用。

💡 **NIM微服务与AI蓝图**:英伟达推出了适用于RTX AI PC的NIM微服务,可轻松访问和部署最新生成式AI模型,并与多个AI开发框架兼容。AI蓝图则基于NIM微服务,为数字人类、内容创作等提供预配置参考工作流程,如PDF转播客蓝图和3D引导生成式AI蓝图。

🧠 **Nemotron模型家族**:Nemotron模型家族包括Llama Nemotron和Cosmos Nemotron,前者擅长指令遵循和函数调用等任务,后者则可分析和响应图像及视频。这些模型经过优化,可在多种英伟达加速计算资源上运行。

今天,老黄穿着全新的皮衣,在CES上一波接一波放大招。

先是发布了自家最新的GPU——RTX 5090

直接来看下基于Blackwell架构的最新GPU主要性能:

    具备1.8 TB/s的内存带宽,能够快速地读取和写入数据

    具有125 Shader TFLOPS的着色器性能

这一50系列GPU的价格也直接一道公布:

而Blackwell架构关键的互联技术也上了波新的——NVLink72

依旧是快速来看下主要性能亮点:

    72个Blackwell GPU具备1.4 ExaFLOPS TE FP4计算能力

    576个存储芯片,总容量14TB,带宽1.2PB/s

    18个NVLink交换机,全连接带宽130 TB/s

非常有意思的是,老黄现场还手持巨大的样品,宛如一个盾牌,开始了整活儿:

除此之外,AI超算,现在迎来了PC时刻。

因为就在刚刚,老黄一道还发布了全球最小的个人AI超级计算机——Project Digits

有多强悍?

2000亿参数的大模型,直接在你办公桌上就能跑!

如果把两台Project Digits一块“食用”,那么还可以跑4050亿参数的大模型。

据了解,每个Project DIGITS配备了128GB统一、相干内存和高达4TB的NVMe存储,仅需标准电源插座即可运行。

并且在桌面系统上对大模型搞完开发或推理之后,还可以无缝部署到加速云或数据中心基础设施里。

正如老黄在现场所说的那样:

AI将成为每个行业、每个应用的主流。

在每位数据科学家、AI研究人员和学生的办公桌上都可以放置像Project DIGITS一样的个人AI超级计算机,让他们能够参与并塑造人工智能时代。

而且Project DIGITS不用等太久哦,今年5月份就会开始提供,起售价3000美元

那么Project DIGITS又是如何做到又小又彪悍的呢?

搭载了全新的GB10超级芯片

Project DIGITS的关键,就在于它搭载的全新Grace Blackwell超级芯片

这个系列芯片想必大家并不陌生了,基于Grace Blackwell架构,是一款片上系统。

在FP4精度下可以提供高达1千万亿次浮点运算的AI性能。

GB10包含了英伟达Blackwell GPU,通过NVLink-C2C芯片到芯片互连连接到高性能NVIDIA Grace CPU。

据了解,联发科参与了GB10的设计,对提升能效、性能和连接性等方面起到了一定作用。

‍基于这样的架构,企业和研究人员可以在本地运行Linux系统的Project DIGITS上进行模型原型设计、微调与测试,再部署到NVIDIA DGX Cloud等上面。

用户还可以访问大量AI软件库,包括NGC目录和开发者门户中的软件开发工具包、编排工具、框架和模型等,可用NVIDIA NeMo框架微调模型、NVIDIA RAPIDS库加速数据科学,运行PyTorch等常见框架。

还可利用NVIDIA Blueprints和NVIDIA NIM微服务构建智能AI应用;据了解,从实验到生产环境时,NVIDIA AI Enterprise许可证提供企业级安全等支持。

允许商用的世界基础模型Cosmos

与此同时,老黄还宣布英伟达将开源允许商用的世界基础模型——Cosmos

Cosmos平台既包括用于生成物理世界合成数据的扩散及自回归Transfomer模型,还有视频Tokenizer以及用来加速视频处理的管道。

其中,Cosmos基础模型在2000万小时的驾驶和机器人视频数据上训练而成,主要用来加速自动驾驶和下一代机器人训练研发。

开发者既可以用Cosmos生成物理合成数据,也可以用英伟达NeMo框架+私有视频数据进行微调。

而如此发布也是基于目前AI技术的发展大势。

具体而言,本次CES大会上,老黄一共介绍了三类模型:

    Super:高性能基线模型,适用于开箱即用的微调和部署;

据介绍,这些模型的参数大约为40亿~140亿,任何企业无论规模大小,都可以自由使用Cosmos模型。

目前已公布的第一批试用者包括机器人公司1X、Agility Robotics,以及自动驾驶领域的Uber、小鹏、比亚迪等。

对了,老黄这次特意官宣丰田将基于英伟达芯片和操作系统开发下一代新能源汽车。

从用法展示来看,Cosmos已经能够帮助工业界和自动驾驶生成大量数据,从而加速相关AI技术研发了。

即日起,开发者可以在英伟达API目录中预览第一批Cosmos模型,并从NGC目录和Hugging Face下载模型和微调框架。

另外,Cosmos也为进一步扩展Omniverse(英伟达工业数字化和物理AI仿真平台)提供了新的可能。

开发者可在Omniverse中构建3D场景,渲染输出后用于Cosmos模型生成合成虚拟环境,最终用于物理人工智能训练。

还有比较壮观的场面,就是老黄站在一排机器人的中间,颇有具身智能boom时代的意味。

还有两个新模型服务

除了非常fashion的世界模型之外,老黄这次还发布了两个大方向的模型服务。

一个是AI基础模型,主要适用于RTX AI PC,主打的就是轻松、灵活开发。

具体而言,通过连接到图形用户界面的NIM微服务,用户可轻松访问和部署最新生成式AI模型。

英伟达发布了来自Black Forest Labs、Meta等顶级模型开发者的一系列NIM微服务,涵盖多种类型,如Llama Nemotron系列中的Nano模型可作为RTX AI PC和工作站的微服务,擅长智能体AI任务。

这些微服务包含在PC上运行AI的关键组件,并针对英伟达GPU进行了优化,可在Windows 11 PC上快速下载、设置和运行,且与诸多AI开发和智能体框架兼容。

NIM微服务之外,AI蓝图也即将在PC上可用。

AI蓝图是基于NIM微服务构建而来,主要为数字人类、内容创作等提供预配置参考工作流程。

例如PDF转播客蓝图可提取PDF内容生成脚本及音频,3D引导生成式AI蓝图能让艺术家利用3D场景更好地控制图像生成。

具体到产品,英伟达预览了Project R2X,这是一个具有视觉功能的PC虚拟形象,可通过NVIDIA RTX Neural Faces算法渲染面部,并由新的Audio2Face-3D模型驱动动画,能连接多种AI服务和微服务。

据了解,从今年2月开始,NIM微服务和AI蓝图就可以使用了,多家PC制造商和系统构建商将推出支持NIM的RTX AI PC。

同样是基于NIM微服务,英伟达这次还推出了Nemotron模型家族,包括:

这两个大模型则是更倾向于AI智能体方向。

Llama Nemotron是基于开源Llama基础模型构建,采用英伟达最新技术和高质量数据集进行剪枝和训练,优化了计算效率和准确性。

擅长指令遵循、聊天、函数调用、编码和数学等,尺寸经过优化可在多种英伟达加速计算资源上运行。

尺寸方面同样包含Nano、Super和Ultra三种大小:

    Nano成本效益高,适用于低延迟实时应用和PC及边缘设备;

Cosmos Nemotron视觉语言模型则是结合了英伟达的NIM微服务,可以让开发者构建能分析和响应图像及视频的智能体,应用于多个领域。

One More Thing

就在老黄登上CES之前,英伟达股价又又又创下了历史新高!

涨幅超3%,收盘价为149.43美元,最新估值达到3.66万亿美元,成为仅次于苹果的全球第二大上市企业。

△图源@YahooFinance

不知道这次发布的东西是否符合大家的期待呢?

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

RTX 5090 Project Digits Cosmos模型 NIM微服务 AI PC
相关文章