理想汽车正在研发下一代VLA(视觉-语言-动作)智驾大模型,计划于今年下半年实现落地。该模型结合了端到端和VLM(视觉语言)多模态模型的优势,旨在提升智驾系统对复杂场景的理解能力,从而提高智能驾驶的精准度。VLA智驾大模型是当前智能驾驶领域的核心竞赛之一,理想汽车、吉利汽车和元戎启行都在积极推动其落地。然而,VLA的落地面临芯片性能的挑战,但英伟达即将量产的Thor系列芯片有望解决这一问题。
🧠VLA智驾大模型是理想汽车正在研发的下一代智能驾驶技术,目标是今年下半年落地,旨在提升车辆对复杂驾驶场景的理解和应对能力。
💡VLA模型融合了端到端大模型和VLM多模态模型的优点。VLM在图像和场景理解方面表现出色,弥补了传统端到端模型在决策可解释性和特定场景处理上的不足。
🚀当前,VLA已成为智能驾驶领域的核心竞争点,理想汽车、吉利汽车和元戎启行等企业都在积极推进其应用与落地。
⚙️VLA大模型的落地面临芯片性能的挑战,目前市面上大多数芯片无法支持其运行。英伟达即将量产的Thor系列芯片有望解决这一瓶颈。
快科技3月10日消息,据媒体报道,理想汽车正在研发下一代VLA(视觉-语言-动作)智驾大模型,目标是于今年下半年实现项目落地。
理想汽车在去年二季度财报电话会议上表示已启动端到端VLA模型的研究,将两个模型合二为一,使多模态大模型内化为端到端智驾大模型的一种能力。
那么,VLA智驾大模型与此前的智驾系统有何区别呢?
VLA智驾大模型结合了端到端和VLM(视觉语言)多模态模型的优势,能够提升智驾系统对复杂场景的理解能力,从而提高智能驾驶的精准度。
与端到端大模型相比,VLM对图像和场景的理解能力更强,但端到端大模型存在决策不可解释以及难以处理部分场景的缺陷。
当前,VLA是智能驾驶领域的核心竞赛之一,理想汽车、吉利汽车和元戎启行都在积极推动其落地。
然而,VLA的落地面临较大挑战,除了模型研发需要时间外,目前市面上的芯片性能大多无法支持其运行。
不过,英伟达即将量产的Thor系列芯片有望解决这一问题。
