不止卷硬件！！理想新一代VLA智驾大模型有望下半年落地

快科技资讯 03月10日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

理想汽车正在研发下一代VLA（视觉-语言-动作）智驾大模型，计划于今年下半年实现落地。该模型结合了端到端和VLM（视觉语言）多模态模型的优势，旨在提升智驾系统对复杂场景的理解能力，从而提高智能驾驶的精准度。VLA智驾大模型是当前智能驾驶领域的核心竞赛之一，理想汽车、吉利汽车和元戎启行都在积极推动其落地。然而，VLA的落地面临芯片性能的挑战，但英伟达即将量产的Thor系列芯片有望解决这一问题。

🧠VLA智驾大模型是理想汽车正在研发的下一代智能驾驶技术，目标是今年下半年落地，旨在提升车辆对复杂驾驶场景的理解和应对能力。

💡VLA模型融合了端到端大模型和VLM多模态模型的优点。VLM在图像和场景理解方面表现出色，弥补了传统端到端模型在决策可解释性和特定场景处理上的不足。

🚀当前，VLA已成为智能驾驶领域的核心竞争点，理想汽车、吉利汽车和元戎启行等企业都在积极推进其应用与落地。

⚙️VLA大模型的落地面临芯片性能的挑战，目前市面上大多数芯片无法支持其运行。英伟达即将量产的Thor系列芯片有望解决这一瓶颈。

快科技3月10日消息，据媒体报道，理想汽车正在研发下一代VLA（视觉-语言-动作）智驾大模型，目标是于今年下半年实现项目落地。

理想汽车在去年二季度财报电话会议上表示已启动端到端VLA模型的研究，将两个模型合二为一，使多模态大模型内化为端到端智驾大模型的一种能力。

那么，VLA智驾大模型与此前的智驾系统有何区别呢？

VLA智驾大模型结合了端到端和VLM（视觉语言）多模态模型的优势，能够提升智驾系统对复杂场景的理解能力，从而提高智能驾驶的精准度。

与端到端大模型相比，VLM对图像和场景的理解能力更强，但端到端大模型存在决策不可解释以及难以处理部分场景的缺陷。

当前，VLA是智能驾驶领域的核心竞赛之一，理想汽车、吉利汽车和元戎启行都在积极推动其落地。

然而，VLA的落地面临较大挑战，除了模型研发需要时间外，目前市面上的芯片性能大多无法支持其运行。

不过，英伟达即将量产的Thor系列芯片有望解决这一问题。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签