理想 TOP2 07月08日
不用给理想入选ICCV高评价, 牛的是理想的工作, 不是ICCV
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文探讨了AI学术圈的特点,指出其发展速度快、会议重要性高于期刊等特征。文章重点分析了理想VLA的原始创新度,认为其达到DeepSeek MoE级别,虽低于DeepSeek MLA和Transformer,但在目前中国公司中属高水平创新。理想VLA并非简单跟随特斯拉,而是在VLM基础上进行深度参考和演进,展现出其独立研发能力。

🔍 AI学术圈发展迅速,会议比期刊更重要,但审稿质量有所下降,导致顶会录用论文含金量不如以往。

🚗 理想VLA创新性达到DeepSeek MoE级别,虽不及DeepSeek MLA和Transformer,但在中国公司中属高水平原创。

🧠 理想VLA并非跟随特斯拉,而是在VLM基础上进行深度参考和演进,展现出其独立研发能力,VLM快慢系统类比充电桩和加油站,解决了算力数据不足的问题。

📈 理想通过多篇论文入选ICCV等方式宣传自身技术实力,但真正重要的是其做出的好工作,而非论文数量。

🌟 理想创始人李想具备Think Different的精神,其创业经历和技术实力值得肯定。

原创 理想TOP2 2025-06-29 23:07 四川

这块我很懂, 我上一段创业受众就是ICCV/CVPR/AAAI/ICLR的投稿者

本文结构:先介绍AI学术圈为什么很多特点与其他学科不一样,引入能发多篇顶会的中国公司其实蛮多的,含金量并不高。这块我很懂, 我上一段创业受众就是ICCV/CVPR/AAAI/ICLR的投稿者。

再详细论述理想VLA的原始创新度是DeepSeek MoE级别,没有跟随特斯拉了(VLM之后就不是跟随了,是深度参考),并指出原始创新度低于DeepSeek的MLA,MLA原始创新度低于Transformer。

目前有能力做出MoE级别原始创新的中国公司很少,这块很有含金量。

以下为正文:

25年6月27日,理想自动驾驶负责人表示自动驾驶团队5篇论文中稿ICCV,VLA交付后会把“梯队”拿掉。

李想补充到,理想基座模型团队还有三篇论文被录用,在措辞上对入选ICCV给予了很高评价。

TOP2上一段创业经历受众就是AAAI/ICML/NeurIPS/ICLR/CVPR/ICCV这些顶会的投稿者,所以TOP2对这块特别懂。

AI学术圈与其他学科圈特点有非常多不同

AI学术圈会议比期刊重要 ,本质原因是,AI学术发展速度太快,而期刊审稿周期太长,旧有的以期刊为中心的学术共同体范式难以满足AI学术圈的发展需求。

AI会议会限制页数,原因在于页数一长,审稿根本审不过来。这导致很多优秀的AI论文只有几页,这在其他学科是完全不可想象的。

大部分顶会都是一年办一次,少部分两年办一次,不少AI领域不止一个顶会。比方说AI综合领域的顶会是AAAI/ICML/NeurIPS/IJCAI/ICLR。CV领域的三大会是CVPR/ICCV/ECCV。

所有AI领域的顶会,投稿数/中稿数较十年前都在经历超快速的膨胀,不同会议膨胀比例不完全一致。以AAAI为例,2014-2023,录用数从398提升到1721,投稿数从1406提升到8777,录用率从28.31%降到19.60%。

造成投稿数/录用数的暴增的本质原因是AI真的在爆发。

这种快速爆发导致了2个现象:

1.足够称职的审稿人数量跟不上投稿者的增量,导致审稿质量下降。这直接导致了任何一个顶会,不能保证录用的论文真正很有含金量,实际上有不少论文含金量很有限。(这是圈内人共识,没啥争议)

做一个类比,帮助读者理解,NBA一年选秀60位球员(对应顶会录用者),这60位球员当然都是相对优秀的球员,但是任意一年的NBA选秀球员,都会有很多最后也没打出名堂。(对应录用的论文其实也没含金量)

2.求职维度顶会的含金量也在不断下降,因为优质岗位供给速度跟不上顶会录用者增加的速度

做两个类比帮助读者理解,过去40年,任意学科,任意学校的本科/硕士/博士通用可以获得的保底工作的社会地位,大趋势是非常明确的不断下降。

任意学科获得好学校教职对论文的要求水平都在不断提高。

AI圈的这个变化只会比其他学科更快。

此外,所有的AI顶会,大致都会有1/3至1/2以上,是由中国人贡献的,教职或中国公司都很多。

相较其他学科,商业公司在AI学术圈的参与度很高,真会发很多论文,对于AI产业而言,相较其他学科,高校在资源上有非常多劣势。

综合以上特点,商业公司一次顶会入选多篇论文门槛并不高,很多中国公司都做得到。

李想/理想以八篇论文入选ICCV作为宣传点,核心目的是面向用户/潜在用户宣传自己辅助驾驶,潜在的方案有很多,这只是方法之一。

故理想有多少篇论文入选顶会,其实都还好,最重要的是理想真的做出了好的工作。

理想之前的VLA,最有名的两篇论文是OpenVLA和Emma,OpenVLA输出的是机器人控制指令,Emma输出的是行驶轨迹。理想的确也参考了这两篇论文,但从这两篇论文,到能实现真正普通乘用车量产,中间有巨多的工作是无人区,没有领头人。

无人区也分很多层次,理想的VLA 在无人区上的层次是 DeepSeek MoE(混合专家)级别的,无人区突破度弱于DeepSeep的MLA(多头潜在注意力机制),MLA的无人区突破度又弱于Transformer。

VLA和MoE本身的想法都有其他人先提过了,都是首次完整落地到另一个大领域,在其中有大量创新,并取得良好结果。

MLA创新尺度是这个方法的理念之前没人提过。

能做出MoE水平创新的中国公司数量远少于可以一届AI顶会入选多篇论文的,这块含金量很高。

目前还有很多人以为理想在自动驾驶领域是在跟随特斯拉,其实已经完全不是了。

在V10-11时期,说理想是在跟随特斯拉没有任何问题,从V12开始,理想跟随特斯拉的尺度越来越低。

确实是因为特斯拉说端到端是work的,让理想敢于去尝试端到端,这没有认为问题。

理想的VLM由系统一(快系统),系统二(慢系统)组成,其中快系统的部分说是跟随特斯拉也是一点问题没有。

但是慢系统部分,说跟随特斯拉就有问题了,因为特斯拉压根就没提这个点。

类比:特斯拉拥有更多的超充桩(类比算力/数据),所以特斯拉可以直接纯电行驶。理想超充资源不足(算力/数据不如特斯拉),所以决定出一款增程车(快系统类比纯电部分,慢系统类比加油部分,特斯拉丝滑度更高类比电池比增程车电池大很多)。

提醒读者注意,任意两个事物不太可能所有细节都可以类比,理想VLM 快慢系统衔接顺畅程度是远没有增程车用电用油那么好。更恰当一点的类比是,理想VLM是2018年的充电桩密度,加油站密度只有充电桩密度的1/20,但是在1/20的情况下比充电桩更有用。(这个类比确实比较绕,TOP2暂时想不到更通俗更直接的类比了)

即理想VLM,是特斯拉作为引路人,让理想敢于去尝试端到端,没有特斯拉,理想即使会尝试,也会更久之后了。但是特斯拉具备理想不具备的一些条件(更多的算力数据),理想想出了VLM这么一个办法(类比充电桩不足的时候我加个增程器),让量产车可以去跑。

在开发VLM过程,是理想自己想到把两个系统合成一个系统,要去做VLA的,即VLM到VLA,不是在追随特斯拉了,而是基于VLM的自然演进路线。

王兴2020年7月的评论是非常有先见性的:“我算是见过中外各国许多创业者了,李想是少有的真能 Think Different 的人。可笑又可叹的是,很多人一方面对已成为传奇的苹果Think Different广告顶礼膜拜,另一方面却对身边正在发生的Think Different视而不见甚至百般嘲讽。叶公好龙。

加微信,进群深度交流理想长期基本面。不是车友群。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

理想VLA 自动驾驶 AI学术圈 DeepSeek MoE 创新
相关文章