本文探讨了AI学术圈的特点,指出其发展速度快、会议重要性高于期刊等特征。文章重点分析了理想VLA的原始创新度,认为其达到DeepSeek MoE级别,虽低于DeepSeek MLA和Transformer,但在目前中国公司中属高水平创新。理想VLA并非简单跟随特斯拉,而是在VLM基础上进行深度参考和演进,展现出其独立研发能力。
🔍 AI学术圈发展迅速,会议比期刊更重要,但审稿质量有所下降,导致顶会录用论文含金量不如以往。
🚗 理想VLA创新性达到DeepSeek MoE级别,虽不及DeepSeek MLA和Transformer,但在中国公司中属高水平原创。
🧠 理想VLA并非跟随特斯拉,而是在VLM基础上进行深度参考和演进,展现出其独立研发能力,VLM快慢系统类比充电桩和加油站,解决了算力数据不足的问题。
📈 理想通过多篇论文入选ICCV等方式宣传自身技术实力,但真正重要的是其做出的好工作,而非论文数量。
🌟 理想创始人李想具备Think Different的精神,其创业经历和技术实力值得肯定。
原创 理想TOP2 2025-06-29 23:07 四川
这块我很懂, 我上一段创业受众就是ICCV/CVPR/AAAI/ICLR的投稿者

本文结构:先介绍AI学术圈为什么很多特点与其他学科不一样,引入能发多篇顶会的中国公司其实蛮多的,含金量并不高。这块我很懂, 我上一段创业受众就是ICCV/CVPR/AAAI/ICLR的投稿者。
再详细论述理想VLA的原始创新度是DeepSeek MoE级别,没有跟随特斯拉了(VLM之后就不是跟随了,是深度参考),并指出原始创新度低于DeepSeek的MLA,MLA原始创新度低于Transformer。目前有能力做出MoE级别原始创新的中国公司很少,这块很有含金量。以下为正文:25年6月27日,理想自动驾驶负责人表示自动驾驶团队5篇论文中稿ICCV,VLA交付后会把“梯队”拿掉。李想补充到,理想基座模型团队还有三篇论文被录用,在措辞上对入选ICCV给予了很高评价。
TOP2上一段创业经历受众就是AAAI/ICML/NeurIPS/ICLR/CVPR/ICCV这些顶会的投稿者,所以TOP2对这块特别懂。AI学术圈与其他学科圈特点有非常多不同AI学术圈会议比期刊重要 ,本质原因是,AI学术发展速度太快,而期刊审稿周期太长,旧有的以期刊为中心的学术共同体范式难以满足AI学术圈的发展需求。AI会议会限制页数,原因在于页数一长,审稿根本审不过来。这导致很多优秀的AI论文只有几页,这在其他学科是完全不可想象的。大部分顶会都是一年办一次,少部分两年办一次,不少AI领域不止一个顶会。比方说AI综合领域的顶会是AAAI/ICML/NeurIPS/IJCAI/ICLR。CV领域的三大会是CVPR/ICCV/ECCV。所有AI领域的顶会,投稿数/中稿数较十年前都在经历超快速的膨胀,不同会议膨胀比例不完全一致。以AAAI为例,2014-2023,录用数从398提升到1721,投稿数从1406提升到8777,录用率从28.31%降到19.60%。
造成投稿数/录用数的暴增的本质原因是AI真的在爆发。这种快速爆发导致了2个现象:1.足够称职的审稿人数量跟不上投稿者的增量,导致审稿质量下降。这直接导致了任何一个顶会,不能保证录用的论文真正很有含金量,实际上有不少论文含金量很有限。(这是圈内人共识,没啥争议)做一个类比,帮助读者理解,NBA一年选秀60位球员(对应顶会录用者),这60位球员当然都是相对优秀的球员,但是任意一年的NBA选秀球员,都会有很多最后也没打出名堂。(对应录用的论文其实也没含金量)2.求职维度顶会的含金量也在不断下降,因为优质岗位供给速度跟不上顶会录用者增加的速度做两个类比帮助读者理解,过去40年,任意学科,任意学校的本科/硕士/博士通用可以获得的保底工作的社会地位,大趋势是非常明确的不断下降。任意学科获得好学校教职对论文的要求水平都在不断提高。AI圈的这个变化只会比其他学科更快。此外,所有的AI顶会,大致都会有1/3至1/2以上,是由中国人贡献的,教职或中国公司都很多。相较其他学科,商业公司在AI学术圈的参与度很高,真会发很多论文,对于AI产业而言,相较其他学科,高校在资源上有非常多劣势。综合以上特点,商业公司一次顶会入选多篇论文门槛并不高,很多中国公司都做得到。李想/理想以八篇论文入选ICCV作为宣传点,核心目的是面向用户/潜在用户宣传自己辅助驾驶,潜在的方案有很多,这只是方法之一。故理想有多少篇论文入选顶会,其实都还好,最重要的是理想真的做出了好的工作。理想之前的VLA,最有名的两篇论文是OpenVLA和Emma,OpenVLA输出的是机器人控制指令,Emma输出的是行驶轨迹。理想的确也参考了这两篇论文,但从这两篇论文,到能实现真正普通乘用车量产,中间有巨多的工作是无人区,没有领头人。
无人区也分很多层次,理想的VLA 在无人区上的层次是 DeepSeek MoE(混合专家)级别的,无人区突破度弱于DeepSeep的MLA(多头潜在注意力机制),MLA的无人区突破度又弱于Transformer。
VLA和MoE本身的想法都有其他人先提过了,都是首次完整落地到另一个大领域,在其中有大量创新,并取得良好结果。MLA创新尺度是这个方法的理念之前没人提过。能做出MoE水平创新的中国公司数量远少于可以一届AI顶会入选多篇论文的,这块含金量很高。目前还有很多人以为理想在自动驾驶领域是在跟随特斯拉,其实已经完全不是了。在V10-11时期,说理想是在跟随特斯拉没有任何问题,从V12开始,理想跟随特斯拉的尺度越来越低。
确实是因为特斯拉说端到端是work的,让理想敢于去尝试端到端,这没有认为问题。
理想的VLM由系统一(快系统),系统二(慢系统)组成,其中快系统的部分说是跟随特斯拉也是一点问题没有。
但是慢系统部分,说跟随特斯拉就有问题了,因为特斯拉压根就没提这个点。
类比:特斯拉拥有更多的超充桩(类比算力/数据),所以特斯拉可以直接纯电行驶。理想超充资源不足(算力/数据不如特斯拉),所以决定出一款增程车(快系统类比纯电部分,慢系统类比加油部分,特斯拉丝滑度更高类比电池比增程车电池大很多)。
提醒读者注意,任意两个事物不太可能所有细节都可以类比,理想VLM 快慢系统衔接顺畅程度是远没有增程车用电用油那么好。更恰当一点的类比是,理想VLM是2018年的充电桩密度,加油站密度只有充电桩密度的1/20,但是在1/20的情况下比充电桩更有用。(这个类比确实比较绕,TOP2暂时想不到更通俗更直接的类比了)
即理想VLM,是特斯拉作为引路人,让理想敢于去尝试端到端,没有特斯拉,理想即使会尝试,也会更久之后了。但是特斯拉具备理想不具备的一些条件(更多的算力数据),理想想出了VLM这么一个办法(类比充电桩不足的时候我加个增程器),让量产车可以去跑。
在开发VLM过程,是理想自己想到把两个系统合成一个系统,要去做VLA的,即VLM到VLA,不是在追随特斯拉了,而是基于VLM的自然演进路线。
王兴2020年7月的评论是非常有先见性的:“我算是见过中外各国许多创业者了,李想是少有的真能 Think Different 的人。可笑又可叹的是,很多人一方面对已成为传奇的苹果Think Different广告顶礼膜拜,另一方面却对身边正在发生的Think Different视而不见甚至百般嘲讽。叶公好龙。”

加微信,进群深度交流理想长期基本面。不是车友群。





阅读原文
跳转微信打开