英伟达在GTC大会上展示了Blue机器人,并开源了用于训练机器人和自动驾驶汽车的多模态世界模型Cosmos-Transfer1。Cosmos-Transfer1是Cosmos模型的一部分,是一个预训练的扩散式条件世界模型,能够根据多种空间控制输入数据生成模拟,并支持在不同空间位置和时间上为不同条件输入加入权重。该模型已在Hugging Face开源,包含两个模型及其推论范例,方便用于自动驾驶汽车或机器人等自动系统的训练。
🤖Cosmos-Transfer1是英伟达Cosmos模型的一部分,旨在加速开发者构建“实物AI”系统。它是一个预训练的扩散式条件世界模型,用于生成多模态、可控的虚拟世界。
🗺️Cosmos-Transfer1能够根据分割图、深度图和边缘图等多种空间控制输入数据建立模拟,并在不同空间位置和时间上灵活地为不同条件输入加入权重,从而实现虚拟世界的客制化生成。
🚗Cosmos-Transfer1已在Hugging Face开源,提供了两个模型及其推论范例,分别是Cosmos-Transfer1-7B(通用型)和Cosmos-Transfer1-7B-Sample-AV(自动驾驶专用)。
💻这两个模型均需在80GB H100硬件平台上运行。后训练脚本程序也将很快发布。模型本身以Nvidia Open Model授权开源,而训练脚本则以Apache 2 授权开源。
本周Nvidia GTC大會上展示了Blue機器人的同時,也開源訓練機器人及自駕車的多模態世界模型Cosmos-Transfer1。
Cosmos-Transfer1是Nvidia Cosmos模型的一部分。Cosmos是協助開發人員更快且更有效打造「實體AI」(Physical AI)系統的世界基礎模型。而Cosmos-Transfer1則是經預訓練的擴散式條件世界模型(conditional world model),可用於生成多模態、可控制的虛擬世界。它根據多種空間控制輸入資料,像是分割圖、深度圖及邊緣圖(edge maps)等建立模擬,還能在不同空間位置和時間彈性為不同條件輸入加入權重,以客製化生成虛擬世界。這種彈性使之方便用於自駕車或機器人等自動系統訓練的應用程式,例如Sim2Real。
Cosmos-Transfer1已在Hugging Face開源,開源的資源包含二個模型及其推論範例,Cosmos-Transfer1-7B為適應性多模態控制的世界生成模型,Cosmos-Transfer1-7B-Sample-AV為開發自駕車專用的Cosmos-Transfer 1。二個模型都需在80GB H100硬體平臺上執行。
後訓練腳本程式也會很快釋出。模型本身是以Nvidia Open Model授權開源,而訓練腳本則是以Apache 2 授權開源。