36kr-科技 2024年12月27日
理想智驾,急下猛药
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

理想汽车在智能驾驶领域起步较晚,但今年明显加速追赶。文章分析了理想智驾发展较慢的原因,指出其早期忽视了工程经验积累的重要性,认为数据和工程经验对自动驾驶同等重要。理想今年大力发展智驾的原因是其对销量影响显著。理想在端到端技术上并非首发,但坚持“端到端+VLM”路线,认为其能更好应对未知场景。理想坚持使用激光雷达,并计划在2025年实现L3有监督自动驾驶,但面临数据和技术挑战。理想认为L2辅助驾驶无法实现L4自动驾驶,需要通过能力而非功能迭代来实现。

🚗理想汽车在智驾领域起步较晚,但今年明显加快了追赶步伐,原因在于其发现智能驾驶对汽车销售具有显著影响。

⚙️ 理想认为智能驾驶不仅依赖于数据,还依赖于工程能力的积累,而工程能力需要通过实践经验积累,数据和工程经验对自动驾驶的影响各占50%。

💡 理想坚持“端到端+VLM”的路线,认为这种方式是目前处理未知场景的最佳方案,同时坚持使用激光雷达,认为其在暗光环境下比摄像头更可靠。

🛣️ 理想认为L2辅助驾驶无法直接升级到L4自动驾驶,必须通过能力而非功能迭代,并计划在2025年实现L3有监督自动驾驶,但面临数据量和技术上的巨大挑战。

💰 理想认为要拿到L4自动驾驶的门票,需要满足三个条件:销量达到500万以上、掌握VLA技术、以及拥有足够资金招募顶尖人才并投入算力。

理想从2021年自研智驾开始,到目前差不多三年时间,但今年是理想在智驾上说的最多的一年。头部新势力中,理想是最晚发力的一家。小鹏和蔚来2016年开始,自动驾驶公司Momenta是2016年,华为是2019年开始。

理想智驾 加速追赶

这里需要回答两个问题,为什么慢了?为什么今年智能驾驶提的最多?

第一个问题,理想没有正面回答,理由大家都知道,因为之前的历史遗留问题。但李想认为这不重要,他认为智能驾驶最重要的还是数据。算法,人才等其他要素都可以通过资金来弥补。

我同意这个说法,但理想忽略了一个问题,智能驾驶不仅跟数据有关,还跟工程能力有关,工程能力是积累,是无数个日夜的脏活苦活累活熬出来的经验,这一步不能跨越。比如模型在芯片上的部署,如何调整相关参数,降低功耗延迟等,都需要一点点的积累沉淀。决定自动驾驶强弱的指标中,数据和工程经验的影响因素各占50%。

再来看第二个问题,为什么今年讲的最多?

理想的答案是因为今年开始发现智驾对卖车有巨大影响。理想给了一组数据,今年2月AD Max的交付量占比只到20%左右,今年下半年超过50%。

当然,还有一个没提到的原因是因为今年确实有点东西了,2021年布局时间太短,之前能讲的东西确实不多。

延展到理想对待端到端的态度,在宣发口径上,商汤绝影在2022年就是开始提端到端,地平线作为第一作者在2023年发布了相关论文UniAD,并且获得了当年CVPR的最佳论文,首次为自动驾驶端到端通用网络架构的设想给出了具体范式。但是Momenta CEO曹旭东说他们在2019年就开始用端到端做规控算法。

简而言之,在端到端上,理想依然不是第一个发力的选手,即便从宣发口径上,小鹏在520当天宣布两段式端到端落地,研发时间肯定还要提前。但理想表示自己其实很早就注意到了端到端的价值,一直没有做的原因是在等足够的数据和算力。理想认为端到端 VLM大模型本质是用人工智能来做自动驾驶。人工智能的三个要素:算法、数据和算力,三者缺一不可。

理想今年准备好了,所以就开始着手了。理想给出的数据支撑是到今年初其(高质量训练)数据量达到10亿(公里) 左右规模,这是一个基础。第二是算力基础今年初也到了5EFLOPS。

理想坚持用“端到端+VLM”的理由是,当一套智能驾驶系统遇到没有见过的场景时,端到端+VLM是当下最好的处理方式,但端到端+VLM的能力也已经快逼近极限,因为VLA已经在预研中。

理想也解释了为什么一直坚持用激光雷达的原因。因为摄像头黑夜最高只能看到100米,激光雷达可以看到200米。其实还是老生常谈的问题,摄像头很难处理暗光场景,理想去掉了角雷达,会一直保留激光雷达,理想认为激光雷达是安全带。李想认为,如果特斯拉在中国一定会使用激光雷达。

按马斯克的风格应该不会,老马的理解是他认为激光雷达信号对相机信息是一种干扰。本质上是技术理念的不同。

靠L2无法实现L4 2025年实现L3

理想认为L2是辅助驾驶,而L3(有监督自动驾驶)、L4属于自动驾驶,L3是L4的先导。通过L2永远无法实现L3,也就是所谓的自动驾驶。

这里延展另外一个话题,特斯拉的逻辑是用一套系统实现辅助驾驶和Robotaxi。这里有两种说法,一种是辅助驾驶属于L2,Robotaxi属于L4,特斯拉通过数据驱动的方式实现L2向L4的跨越,这个理念和理想相悖;另一种是特斯拉用FSD实现的Robotaxi也属于L2的辅助驾驶范畴。

理想认为自动驾驶是能力、辅助驾驶是功能。功能是预设条件,在开发这个功能之前就一定预设了他的能力上限,但是能力没有边界,可以不断持续成长和迭代。大白话说就是一个可持续,一个不可持续。这个问题其实今年6月李想在重庆论坛上提到过这个点。

理想认为,要想实现有监督智能驾驶,一个前提是实现车位到车位,也就是解决最前面一百米和最后面一百米。智驾从小区车位开始,然后包括园区道路、泊车、城市道路,还有高速和收费站ETC都会全部打通。

理想还表示,如果按照端到端+VLM这套体系,有可能在2025年实现L3,也就是所谓的有监督自动驾驶。

所以,新的问题是,如何去定义有监督的自动驾驶?出了问题是谁的责任?

理想近期目标是今年综合MPI(城市+高速综合接管里程)做到100公里接管一次的能力。而且不是安全接管,是体验接管,用户觉得不舒服接管。到明年、后年提升至500公里、甚至1000公里以上。要达到这个目标的前提条件是达到500公里的综合MPI(城市+高速综合接管里程),预计需要2000万Clips(视频片段)的水平。按照理想的说法,如果2000万Clips从不到5%的老司机去筛选,总数据要突破50亿公里甚至上百亿公里。

坦白说难度很大,特斯拉今年4月智驾总数据突破10亿英里,差不多是16亿公里,全球销量在600万台左右。理想今年11月刚突破100万,总数据10亿公里。按比例去推,100亿数据需要1000万总销量。当然以后车越买越多,数据增长一定是非线性的,但是突破百亿公里总里程绝非易事。2025年可能性几乎为零。

理想认为拿到L4门票需要3个条件:销量500万以上;自己掌握VLA(视觉语言行动模型);足够多的钱去招募最顶级人才,并且堆算力。

总而言之,理想这两年的智驾可以说是急下猛药,效果如何,拭目以待吧。

本文来自微信公众号“圆周智行”,作者:圆周智行,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

理想智驾 端到端 VLM 自动驾驶 激光雷达
相关文章