郎咸朋解释为什么理想一定要自己做基座模型

2025年3月17日张小珺在小宇宙APP上放了24年12月采访郎咸朋的音频。

郎咸鹏是理想自动驾驶负责人，以下为其解释的为什么理想一定要自己做基座模型，另外文中的去年指2023年，今年指2024年。

郎咸朋

刚开始的时候你问我那个基座模型的问题，这个其实也是我们最近一段时间跟李想聊了非常多的。比方说从去年我们就一直在跟李想说，我们可能是需要做自己的基座大模型的，多模态的大模型。现在看起来我觉得习以为常了，就跟当年质疑我们为什么做自动驾驶一样，已经有GPT，已经有千问，文心一言等等，就有这么多大模型可以让你用。

为什么理想你还要自己做自己的基座模型，是不是很难？很多人都觉得我不要做技术模型，技术模型既费力又费钱，投入还很巨大。而且现在还有很多人在做了，已经大公司在做了，你也做不过它。现在看起来像是这样的，为什么你要做这个事情？我觉得想哥他是有这么几点，我不知道他说了什么，但是我也没和他对过。我觉得我们的优势是这样，第一是必要性，第二是可行性。

首先必要性来讲的话，我觉得我们如果以后想在人工智能领域得到非常长久的发展的话，基座模型是必须的。就相当于说你要做一个建筑商，你自己没有建筑工人，那肯定不行，对吧？你光外包，哪天这个工人不给你干了，你这不是什么都没有了吗？我们基座模型就如同是与你的这个地基和基石一样。如果你没有它的话，上面盖的多好楼房都是控制楼阁。当有一天基座模型不给你用了，这是供应风险。

第二，如果说通用基座模型的话，它有可能跟你的要求不一致。那个时候它不太会按照你的这个要求，它可能有很多的客户，他会适用于所有人去优化它的基座模型，而不是针对你自己一个人。如果是这样的话，你不会在人工智能的领域上就获得这个头部的位置的。

第三，我觉得就是现在你别看它说的好啊，我基座模型服务你们所有人。等哪天真做好的话，它就是那个头部企业了，咱们这些人可能都给他打工了，我是这么判断的，它垄断了就可以。我觉得人工智能的企业没有那种百花齐放。我觉得还是我比较相信就是会收到为数不多的几个真正有基座大模型能力的企业手里面。

张小珺

开始的那个问题。那这两个怎么合并在一起？自动驾驶和理想同学这两件事。

郎咸朋

我觉得理想同学和自动驾驶，甚至后面的智能工业，反正是理想相关的所有的智能的东西，它都是在基座模型上的一个应用的体现。我有一个基座的模型，这个模型它有了理解世界能力，有了非常多的这种知识的基础之后，在它的基础上我去做智能驾驶，做理想的同学，做智能工业都是可以的。就举自动驾驶的例子来讲，我们将来要做VLA。

张小珺

这个将来是多将来？

郎咸朋

就是现在就已经开始在做预研了，1到3年之内，大家可以看到，但是VLA就是终局。我不知道。一切都是需要有一个基座模型为基础的，它代表了你这个企业的核心能力，就是你对这个世界的理解和对这个知识的掌握程度。然后在这基础上你再去学怎么开车，怎么做对话，怎么做机器人，怎么去做的东西。我觉得是这个能力。我不知道说的表达清楚没有，就是我需要这样一个基座模型，然后协助我去做自动驾驶，协助我去做理想同学，而不是说理想同学。我这训一个。

张小珺

专门为理想同学的模型。

郎咸朋

对，自动驾驶训自动驾驶的模型，这个是不可能。而且将来的人工智能，现在智能我觉得还是太初级了。就是我这边比如说我训个VLM，它只是自动驾驶的VLM，它换个场景就不行了。将来的那个智能一定是触类旁通的，它是一个非常全面的一个智能。比如说我想去自动驾驶了，自动驾驶我前面有有个井盖，井盖掀起来了，漏了个窟窿，就这么一个场景。如果说我现在用自动驾驶的这个方式去训的话，我要收集很多的井盖，反正这种一些训练。但是如果说我有一个基座模型的话，它对整个物理世界它有基本的理解的。

张小珺

它是你刚才画的那张图是在世界模型那个地方吗？

郎咸朋

不是，它还不是，它是一个完整的一个大的模型，就是我上面说的VLA，就是端到端加VLM合在一起的那个模型。世界模型都是它的一部分，他给他们提供关于知识。

张小珺

MindGPT应该在哪，你能不能画一下？

郎咸朋

在基座，这最底下，这是我们的MindGPT，就是我们大模型，在上面长出来很多的东西。对，其中有一个叫自动驾驶。我的自动驾驶里边有我可以是一个VLA对吧？加一个世界模型，word model什么东西，或者里边再有什么，但是这些都是用他的能力去做的。

郎咸朋

比方说这是理想的同学，这什么，现在我们是没有这个东西的，就每个人都在训自己的东西。这样的话你这个领域的知识它是不知道的。这个领域就是每一个领域之间是是是没有互通的，我们希望是有一个统一的基座大模型，他什么都知道。比方说那个井盖什么东西的，我就不用说交给它这是井盖了。在这里边他知道这是个井盖儿，这是个窟窿，这是个危险的区域。我用他的能力之后，我再去做自动驾驶，公司所有的知识，我这边的数据和座舱的数据和工厂的数据和什么数据和或者说现在互联网的数据，我们统一的都放在MindGPT的一个超大的模型里。他就把它训练好，训练成一个有综合知识这样一个理解能力的模型。

张小珺

所有数据，这也是自动驾驶，理想同学，后面还有一个智能商业和智能工业对吧？

郎咸朋

就是我们所有的智能东西你可以都可以在上面长出来。.

张小珺

现在MindGPT是说他现在还不够ready是吧？

郎咸朋

现在非常早期。

张小珺

他要强大到什么程度上，它才能成为所有的基座。

郎咸朋

它首先要把所有的数据都进来，多模态。首先它是多模态的，它既有视频又有声音，又有文字，又有图像等等，反正就是它多模态的这样一个数据都能进来。然后其次是他要涵盖所有的领域。

加微信，进群深度交流理想长期基本面。不是车友群。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签