富途牛牛头条 06月12日 00:40
Meta推出世界模型V-JEPA 2,擁有先進的視覺理解和預測性能
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Meta发布开源模型V-JEPA 2,旨在提升AI对3D环境和物理世界的理解能力。这款拥有12亿参数的模型经过百万小时视频训练,具备先进的视觉理解与预测性能。V-JEPA 2通过构建内部虚拟环境,让AI以更接近人类的方式学习和决策。它在自动驾驶和机器人领域具有广阔应用前景,能够识别物体运动规律,预测行为后果。Meta认为,该模型将推动机器人技术发展,实现AI助手在无需大量训练数据的情况下完成任务。

💡 V-JEPA 2是一款由Meta推出的开源世界模型,旨在帮助人工智能更好地理解3D环境和物理世界。

⚙️ 该模型拥有12亿参数,经过超过100万小时的视频训练,在视觉理解和预测方面表现出色。

🚗 V-JEPA 2通过构建内部虚拟环境,让AI能够以更接近人类的方式进行学习、规划和决策,这使其在自动驾驶汽车和送货机器人等领域具有应用潜力。

🚀 V-JEPA 2通过简化后的“潜在空间”进行推理,从而理解物体的运动、相互作用和响应,Meta声称其速度比英伟达的Cosmos模型快30倍。

①Meta推出開源模型V-JEPA 2,助AI理解3D環境和物理世界運作;②V-JEPA 2擁有12億參數,經100萬小時視頻訓練,擁有先進的視覺理解和預測性能。

財聯社6月12日訊(編輯 牛佔林)美東時間週三, $Meta Platforms (META.US)$ 推出了一款新的開源模型V-JEPA 2,可以讓人工智能更好地理解3D環境並推理物理世界的運作規律。

Meta聲稱,V-JEPA 2是一款世界模型,可以幫助機器人和其他人工智能主體理解物理世界,並預測物理世界將如何對它們的行動做出反應。

據悉,這種被稱爲世界模型的系統從物理世界的邏輯中汲取靈感,並按照現實世界的規則構建內部虛擬環境,從而讓人工智能能夠以更接近人類的方式進行學習、規劃和決策。

Meta表示,V-JEPA 2是一個擁有12億參數的模型,經過了超過100萬小時的視頻訓練,在物理世界中實現了最先進的視覺理解和預測性能。

例如,在Meta的新模型中,V-JEPA 2可以識別從桌子上滾下來的球會掉下來,或者隱藏在視野之外的物體不會消失。

Meta認爲V-JEPA 2在自動駕駛汽車和送貨機器人等方面的應用具有很多優勢,因爲它們需要在複雜多變的環境中安全地工作。

與依賴大量標記數據或視頻片段的模型不同,V-JEPA 2通過簡化後的「潛在空間」進行推理,以理解物體是如何移動、相互作用以及如何響應的。

根據Meta的說法,V-JEPA 2比英偉達的Cosmos模型快30倍,後者也試圖發展與物理世界相關的人工智能。然而,Meta可能會根據不同於英偉達的基準來評估自己的模型。

Meta首席人工智能科學家Yann LeCunn聲稱,讓機器理解物理世界與讓它們理解語言是截然不同的。「世界模型提供了一個虛擬的、簡化版的現實世界,人工智能可以參考它來理解世界,預測其行爲的後果,因此它將能夠計劃一個行動方案來完成給定的任務。」

LeCunn補充說:「我們相信,世界模型將爲機器人技術開啓一個新時代,讓現實世界中的人工智能助手能夠在不需要海量訓練數據的情況下,幫助人們完成家務和體力勞動。」

編輯/rice

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Meta V-JEPA 2 人工智能 世界模型
相关文章