AI & Big Data 01月08日
Nvidia發表Cosmos平臺,大幅簡化機器人和自動駕駛開發
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Nvidia在CES发表Cosmos平台,加速实体人工智能发展,特别是机器人和自动驾驶领域。该平台集结多种先进技术,解决过去发展受限问题,提供强大开发工具,已有多家公司采用其技术。

🎯Nvidia推出Cosmos平台,加速机器人和自动驾驶领域发展,集结多种先进技术。

💻Cosmos平台的核心是世界基础模型,能生成逼真合成资料,供训练与测试。

🚀采用Nvidia Cosmos Tokenizer作为视觉分词器,提高影像与影片处理效率。

📽️借助Nvidia NeMo Curator的工作管线,开发者可快速处理大量影片资料。

Nvidia於CES發表全新Cosmos平臺,加速實體人工智慧(Physical AI),特別是機器人和自動駕駛領域的發展。Cosmos集結了先進的生成式世界基礎模型、高效能視覺分詞器(Tokenizer)、安全性防護機制以及影片處理工作管線,提供相關領域開發者強大的開發工具。過去實體人工智慧的發展始終受限於高昂的開發成本、龐大的資料需求以及繁瑣的測試流程。Nvidia現在推出Cosmos平臺,期望大幅解決這些問題,降低技術門檻,讓更多開發者能夠跨進實體人工智慧開發領域。Cosmos平臺的核心則是Cosmos世界基礎模型(World Foundation Model,WFM),這些模型能夠生成基於物理原理且極為逼真的合成資料,提供機器人和自動駕駛系統訓練與測試所需的模擬環境。同時,開發者還可利用自身的資料集,對這些模型進行微調,以符合特定應用需求。Nvidia執行長黃仁勳在CES演講提到,Cosmos是第一個世界基礎模型,他們利用2,000萬小時的影片資料訓練,專注於捕捉物理動態物體,從自然景象到人類行為,這些影片涵蓋了行走、手部動作,甚至快速相機運動等主題,教導人工智慧理解真實世界中的動態變化,進而讓人工智慧能夠更精確地模擬和預測物理世界的行為。除了強大的世界基礎模型之外,Cosmos還整合了部分Nvidia特有的技術。其中,採用Nvidia Cosmos Tokenizer作為視覺分詞器,能將影像與影片高效轉換成電腦可處理的Token,Nvidia指出,Nvidia Cosmos Tokenizer與目前最先進的編碼器相比,總壓縮率提高至8倍,處理速度則提升為12倍。此外,藉由Nvidia NeMo Curator提供的影片處理加速工作管線,開發者可在短時間內處理並標記大量的影片資料,短短14天的時間處理、整理和標記2,000萬小時的影片資料,而傳統僅使用CPU的處理方式則需要三年多的時間。Nvidia強調,Cosmos平臺的效能相較於傳統僅使用CPU的處理方式,有著大幅度提升,可縮短開發周期。Nvidia採用開放模型授權的方式,鼓勵產業共同參與,目前已有機器人和汽車等多家公司採用Cosmos技術,包涵1X、Agile Robots、Agility、Figure AI、Foretellix,叫車服務Uber也與Nvidia合作,透過結合豐富的駕駛資料與Cosmos平臺,及Nvidia DGX Cloud運算能力,助自動駕駛產業的合作夥伴高效建立人工智慧模型。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Nvidia Cosmos 实体人工智能 机器人 自动驾驶
相关文章