2025-07-17 21:54 浙江
Datawhale干货
对谈:黄仁勋,编译:数字开物
7月17日上午,在第三届中国国际供应链促进博览会先进制造主题活动中,英伟达创始人兼首席执行官黄仁勋对话之江实验室主任、阿里云创始人王坚,本次对话围绕人工智能的过去、现在与未来展开,深入探讨了其技术演进、核心驱动力、对科学和产业的影响,以及对年轻一代的启示。
以下是经过编译整理的对话全文:
王坚:大家早上好。
王坚:Jensen,欢迎来到供应链博览会。很高兴时隔许久再次见到你。我已经在手机上准备好了我的问题。
黄仁勋:我们第一次在北京见面是哪一年?是很久以前了。
王坚:应该是在 2012 或 2013 年,距今差不多十年了。我同样感到非常高兴的是,当我到访硅谷时,您是真正能把公司技术讲得明明白白的人。感谢您当时在硅谷抽出宝贵时间,带我参观了您的公司。
王坚:那时我深刻地体会到,一家公司的创始人是何等重要。从您身上,能看到您对自己所从事事业的那份热忱。
黄仁勋:当时我们刚开始交流的时候,聊的还是计算机图形学。
王坚:还有移动设备。
黄仁勋:没错。那是 2012 年。您可能在刚才的视频里也看到了……
王坚:是的。
黄仁勋:我在 2007 年第一次来到中国谈论 CUDA,那真是很久以前了。
王坚:是非常久以前了。
黄仁勋:真是不可思议,我们相识已久。
王坚:谢谢,很高兴能再次见到您。
黄仁勋:我也很高兴见到您。
王坚:我还记得第一次听您演讲,那是在洛杉矶的 SIGGRAPH 大会上。他们可能听不清您的声音,所以请大声一点。那真是非常非常久远的事情了。您发明了 GPU,彻底改变了整个图形领域的面貌。而现在,我们又迎来了 AI 时代。这真是一段非凡的历程。
AI的技术演进与阶段
王坚:我想向您请教的第一个问题是关于技术的。AI 现在是一个热词,大家对 AI 和 AI 计算的看法各不相同。在您看来,过去几年里,这个领域究竟取得了哪些根本性的进展和变革?
黄仁勋:这个问题问得很好。首先,AI 是一种基于第一性原理 的全新软件开发范式。它不再是人类编写代码、描述算法来预测结果,而是利用算法从样本数据中学习如何去预测结果。
事实证明,这种利用计算机学习预测的方法,具有极强的可扩展性。我们在机器学习领域深耕已久,但 2012 年的 AlexNet 才真正带来了行业的“宇宙大爆炸”。那次事件证明了深度学习 的惊人效果——在计算机视觉领域,它远超当时计算机科学家的能力。
从 2012 年开始,在接下来的大约五年里,您和我都亲眼见证了,先是计算机视觉技术日趋有效,然后达到超越人类的水平;接着是语音识别技术,同样先是变得高效,然后超越人类;此后不久,语言理解能力也实现了有效并超越人类。所有这些不同模态 的进步,构成了第一波浪潮,我们称之为“感知 AI”。
第二波浪潮是生成式AI 。现在我们可以实现从一种模态到另一种模态的转换:从英文到中文,从英文到图像,从图像到英文,从中文到视频。生成式 AI 的本质就是翻译——一种终极的翻译。生成式 AI 的发展大概始于七年前,至今势头依旧非常强劲。所以,现在的 AI 既能理解信息,也能生成信息。
我们当前所处的浪潮同样非同凡响,它被称为“推理”。推理之所以如此有效和强大,是因为 AI 能够像人类一样,去理解和解决它从未见过的问题。我们可以将一个问题一步步地分解,并解决那些我们自己也未曾解决过的难题。这就是推理 AI。而下一波浪潮将是“物理 AI”,届时所有这些能力都将被赋予给实体机器,例如机器人。
所以在过去的大约 12 年里,AI 的发展一日千里。似乎每三到五年,我们就能见证一次重大突破。我认为,我们正接近一个临界点,届时 AI 将能够解决绝大多数认知任务,并在大多数测试中的表现优于多数人类。这个水平我们称之为 AGI。这也正是为何现在人人都在讨论人工超级智能。就像最初我们能实现高效,然后达到超越人类的高效一样,在解决问题方面,我们应该很快也能达到超越人类的水平。
王坚:这太不可思议了。
黄仁勋:这过去的十年,确实令人难以置信。
王坚:而且您知道,特别是今年,开源模型已经改变了当今 AI 技术和商业的格局。
黄仁勋:在这些技术进步中,哪一项最让您感到兴奋?
王坚:我认为,最让我兴奋的事情之一是,计算才是一切的根本。我们谈论 AI,其背后真正的核心是计算。而计算,正在切实地改变一切。AI 只是我们能看到的应用层。回想 20 年前,我们谈论的是计算机 ,但很少有人谈论计算本身。所以,与其说是计算机在改变世界,不如说是计算机背后的计算能力在改变世界。AI 则将计算推向了新的阶段。从技术角度看,这确实是惊人的。
黄仁勋:没错,就连我们训练模型的方式也在飞速演进。第一个十年,主要由预训练 主导。我们收集大量数据,甚至可能用 AI 来预处理这些数据,然后进行预训练。之后,我们采用人类反馈强化学习 (RLHF),这就像是人类在指导 AI、校准 AI 的行为。
现在,我们已经进入了后训练时代。在这个阶段,AI 自我思考、自我练习,通过强化学习、可验证反馈以及大量的合成数据生成来进行自我测试和学习如何推理。如今所需的计算量之大,简直难以想象。
王坚:您知道吗,我其实有心理学背景。对我而言,AI 并非简单地模拟人类智能,它更是对人类智能的增强,甚至远不止于此。所以在我看来,AI 更像是扩展了人类的创造力,而不仅仅是替代人类的智能。
黄仁勋:汽车扩展了我们人类的移动能力。
王坚:您说得非常对。
黄仁勋:飞机扩展了我们人类的移动能力。而现在,我们有了 AI,它将扩展我们人类的智能。AI 的工作方式与我们的大脑不尽相同,但它能完成和我们类似的任务。
王坚:那么回到开源这个话题,这同样是一个激动人心的时刻。您也知道,我们有 DeepSeek,有来自阿里云的 Qwen,而它们还只是众多优秀模型中的一部分。
黄仁勋:最近还有月之暗面的 Kimi。
王坚:您说得对。
黄仁勋:Kimi 做得相当不错。
AI发展的核心驱动力
王坚:我想问您的是,开源模型是否会成为未来 AI 发展的颠覆性驱动力之一?
黄仁勋:我们刚才还在说 AI 进步神速。人们当然会说,这是因为 NVIDIA 的技术发展迅猛,这的确是事实。过去十年间,我们将 AI 计算的性能提升了十万倍。因此我们能处理更多数据,学习速度也更快。
当然,有一点虽然没有被广泛讨论,但本应如此,那就是绝大多数的 AI 研究都是以开放的形式完成的。全球学者在 arXiv 上发表的论文数量惊人。事实上,我好像看到一个统计数据,中国研究人员发表的论文数量目前已居世界首位。
正在发生的是,在许多方面,研究人员们正在通过开放科学的方式进行合作。当他们发表研究成果时,你可以阅读并做出贡献,我也可以阅读并做出贡献。因此,我们实际上是在开放科学的框架下协同工作。
在此基础上更进一步的,就是开源。我们不仅进行开放的研究,现在还进行开放的工程。这种开放的工程实践极其强大,因为你可以借鉴我的贡献,并加上你的贡献,我再补充我的。如此一来,创新的速度就不再仅仅是单个公司或工程团队的贡献,而是整个生态系统的合力。中国在开源工程方面的实践非常巧妙。
但别忘了,开源具有广泛的全球性影响。开源模型不仅帮助了中国的生态系统,也在帮助世界各地的生态系统。你们的 R1、Qwen 和 Kimi,是当今世界上最顶尖的开放式多模态推理模型。这说明它们非常先进。无论你是谁,是医疗健康公司、金融服务公司还是机器人公司,都可以利用这些成果,并根据自己的应用场景进行修改。
同样需要强调的是,开源是推动技术进步最安全的方式。“阳光是最好的消毒剂”。当你拥抱开源和开放式创新时,你就在主动接受全球科学界的审视。而有了全球科学界的审视,工作的质量自然会提高。如果你去读 DeepSeek 的论文,会发现它写得极为出色,是绝对顶级的科学研究和工程实践。他们完全以开放的方式进行,这既促进了教育、学习和分享,也得益于无数人的审视。因此,这对安全性大有裨益。
王坚:谢谢。顺便一提,DeepSeek 和 Qwen 都来自杭州。我本人就是杭州人,我为这座城市感到非常自豪。我在此个人正式邀请您,下次来华时访问杭州。
黄仁勋:杭州,我是否可以斗胆说,它是中国的硅谷?
王坚:我想我更愿意说,杭州将成为面向世界的创新中心,它有自己独特的魅力。再次向您发出我个人的邀请,期待您下次来访杭州。
黄仁勋:我一定会的,谢谢你。
AI对科学研究的影响
王坚:您刚才提到了开放科学和开放工程。在去年的 GTC 大会上,您说我们正处在人类历史上的一个关键节点,有机会将生物学从一门科学转变为一门工程学科。这个观点也令人震撼。您认为 AI 对科学发现和技术创新的长期影响会是什么?AI 会改变科学家们从事研究的方式吗?
黄仁勋:您看,今天我们主要讨论的是服务于人类的 AI。但服务于科学的 AI,才是我们能产生最深远影响的领域。要记住,面向人类的 AI 相对更容易。原因在于,人类语言是我们自己创造的。使用设计工具也很容易。你我使用设计工具来设计芯片已经很久了。但晶体管是我们自己设计的,所以我们才能用工具去操作晶体管和设计芯片。
但生物学是自然创造的。因此,要操控生物学,我们首先必须理解它。而现在,我们终于有了一种名为人工智能的新能力,可以让我们去学习和理解——理解蛋白质的原理,理解化学物质的原理,理解细胞的原理,当然,还有生命的原理。我们甚至能够理解人体内新陈代谢反应和过程的原理。
如果我们能先用 AI 来理解其结构和原理,那么接下来,我们就能利用 AI 去改进、去配置、去设计药物,帮助人类延长寿命。
王坚:看来这其中蕴藏着巨大的机会。
黄仁勋:AI 带来了巨大的机遇。它的另一个重要应用是模拟物理世界。如今,我们运用物理方程来模拟极其复杂的相互作用,例如天气。天气现象涉及云物理学 (包括高层和低层云) 、大气物理学、海洋物理学、冰物理学以及陆地物理学。此外,我们还要考虑热传导和热对流等过程。所有这些不同类型的物理学必须融会贯通。其尺度跨度极大,从微观尺度一直延伸到宏观尺度。我们称之为中尺度物理学。
在物理学领域,时间跨度可能从几秒钟到数年之久。对于模拟而言,要处理如此大的时间跨度是极其复杂的。但我们或许可以训练一个 AI 来帮助我们进行预测。在预测方面,AI 的速度远超传统的物理模拟。因此,我坚信,无论是利用 AI 理解自然规律,还是利用 AI 模拟自然规律,我们都能借助 AI 推动科学的进步。这意义非凡。
王坚:这项工作太不可思议了,真是令人惊叹。
未来20年,AI 的发展是否还能继续依赖硅
Datawhale干货
对谈:黄仁勋,编译:数字开物
7月17日上午,在第三届中国国际供应链促进博览会先进制造主题活动中,英伟达创始人兼首席执行官黄仁勋对话之江实验室主任、阿里云创始人王坚,本次对话围绕人工智能的过去、现在与未来展开,深入探讨了其技术演进、核心驱动力、对科学和产业的影响,以及对年轻一代的启示。
以下是经过编译整理的对话全文:
王坚:大家早上好。
王坚:Jensen,欢迎来到供应链博览会。很高兴时隔许久再次见到你。我已经在手机上准备好了我的问题。
黄仁勋:我们第一次在北京见面是哪一年?是很久以前了。
王坚:应该是在 2012 或 2013 年,距今差不多十年了。我同样感到非常高兴的是,当我到访硅谷时,您是真正能把公司技术讲得明明白白的人。感谢您当时在硅谷抽出宝贵时间,带我参观了您的公司。
王坚:那时我深刻地体会到,一家公司的创始人是何等重要。从您身上,能看到您对自己所从事事业的那份热忱。
黄仁勋:当时我们刚开始交流的时候,聊的还是计算机图形学。
王坚:还有移动设备。
黄仁勋:没错。那是 2012 年。您可能在刚才的视频里也看到了……
王坚:是的。
黄仁勋:我在 2007 年第一次来到中国谈论 CUDA,那真是很久以前了。
王坚:是非常久以前了。
黄仁勋:真是不可思议,我们相识已久。
王坚:谢谢,很高兴能再次见到您。
黄仁勋:我也很高兴见到您。
王坚:我还记得第一次听您演讲,那是在洛杉矶的 SIGGRAPH 大会上。他们可能听不清您的声音,所以请大声一点。那真是非常非常久远的事情了。您发明了 GPU,彻底改变了整个图形领域的面貌。而现在,我们又迎来了 AI 时代。这真是一段非凡的历程。
AI的技术演进与阶段
王坚:我想向您请教的第一个问题是关于技术的。AI 现在是一个热词,大家对 AI 和 AI 计算的看法各不相同。在您看来,过去几年里,这个领域究竟取得了哪些根本性的进展和变革?
黄仁勋:这个问题问得很好。首先,AI 是一种基于第一性原理 的全新软件开发范式。它不再是人类编写代码、描述算法来预测结果,而是利用算法从样本数据中学习如何去预测结果。
事实证明,这种利用计算机学习预测的方法,具有极强的可扩展性。我们在机器学习领域深耕已久,但 2012 年的 AlexNet 才真正带来了行业的“宇宙大爆炸”。那次事件证明了深度学习 的惊人效果——在计算机视觉领域,它远超当时计算机科学家的能力。
从 2012 年开始,在接下来的大约五年里,您和我都亲眼见证了,先是计算机视觉技术日趋有效,然后达到超越人类的水平;接着是语音识别技术,同样先是变得高效,然后超越人类;此后不久,语言理解能力也实现了有效并超越人类。所有这些不同模态 的进步,构成了第一波浪潮,我们称之为“感知 AI”。
第二波浪潮是生成式AI 。现在我们可以实现从一种模态到另一种模态的转换:从英文到中文,从英文到图像,从图像到英文,从中文到视频。生成式 AI 的本质就是翻译——一种终极的翻译。生成式 AI 的发展大概始于七年前,至今势头依旧非常强劲。所以,现在的 AI 既能理解信息,也能生成信息。
我们当前所处的浪潮同样非同凡响,它被称为“推理”。推理之所以如此有效和强大,是因为 AI 能够像人类一样,去理解和解决它从未见过的问题。我们可以将一个问题一步步地分解,并解决那些我们自己也未曾解决过的难题。这就是推理 AI。而下一波浪潮将是“物理 AI”,届时所有这些能力都将被赋予给实体机器,例如机器人。
所以在过去的大约 12 年里,AI 的发展一日千里。似乎每三到五年,我们就能见证一次重大突破。我认为,我们正接近一个临界点,届时 AI 将能够解决绝大多数认知任务,并在大多数测试中的表现优于多数人类。这个水平我们称之为 AGI。这也正是为何现在人人都在讨论人工超级智能。就像最初我们能实现高效,然后达到超越人类的高效一样,在解决问题方面,我们应该很快也能达到超越人类的水平。
王坚:这太不可思议了。
黄仁勋:这过去的十年,确实令人难以置信。
王坚:而且您知道,特别是今年,开源模型已经改变了当今 AI 技术和商业的格局。
黄仁勋:在这些技术进步中,哪一项最让您感到兴奋?
王坚:我认为,最让我兴奋的事情之一是,计算才是一切的根本。我们谈论 AI,其背后真正的核心是计算。而计算,正在切实地改变一切。AI 只是我们能看到的应用层。回想 20 年前,我们谈论的是计算机 ,但很少有人谈论计算本身。所以,与其说是计算机在改变世界,不如说是计算机背后的计算能力在改变世界。AI 则将计算推向了新的阶段。从技术角度看,这确实是惊人的。
黄仁勋:没错,就连我们训练模型的方式也在飞速演进。第一个十年,主要由预训练 主导。我们收集大量数据,甚至可能用 AI 来预处理这些数据,然后进行预训练。之后,我们采用人类反馈强化学习 (RLHF),这就像是人类在指导 AI、校准 AI 的行为。
现在,我们已经进入了后训练时代。在这个阶段,AI 自我思考、自我练习,通过强化学习、可验证反馈以及大量的合成数据生成来进行自我测试和学习如何推理。如今所需的计算量之大,简直难以想象。
王坚:您知道吗,我其实有心理学背景。对我而言,AI 并非简单地模拟人类智能,它更是对人类智能的增强,甚至远不止于此。所以在我看来,AI 更像是扩展了人类的创造力,而不仅仅是替代人类的智能。
黄仁勋:汽车扩展了我们人类的移动能力。
王坚:您说得非常对。
黄仁勋:飞机扩展了我们人类的移动能力。而现在,我们有了 AI,它将扩展我们人类的智能。AI 的工作方式与我们的大脑不尽相同,但它能完成和我们类似的任务。
王坚:那么回到开源这个话题,这同样是一个激动人心的时刻。您也知道,我们有 DeepSeek,有来自阿里云的 Qwen,而它们还只是众多优秀模型中的一部分。
黄仁勋:最近还有月之暗面的 Kimi。
王坚:您说得对。
黄仁勋:Kimi 做得相当不错。
AI发展的核心驱动力
王坚:我想问您的是,开源模型是否会成为未来 AI 发展的颠覆性驱动力之一?
黄仁勋:我们刚才还在说 AI 进步神速。人们当然会说,这是因为 NVIDIA 的技术发展迅猛,这的确是事实。过去十年间,我们将 AI 计算的性能提升了十万倍。因此我们能处理更多数据,学习速度也更快。
当然,有一点虽然没有被广泛讨论,但本应如此,那就是绝大多数的 AI 研究都是以开放的形式完成的。全球学者在 arXiv 上发表的论文数量惊人。事实上,我好像看到一个统计数据,中国研究人员发表的论文数量目前已居世界首位。
正在发生的是,在许多方面,研究人员们正在通过开放科学的方式进行合作。当他们发表研究成果时,你可以阅读并做出贡献,我也可以阅读并做出贡献。因此,我们实际上是在开放科学的框架下协同工作。
在此基础上更进一步的,就是开源。我们不仅进行开放的研究,现在还进行开放的工程。这种开放的工程实践极其强大,因为你可以借鉴我的贡献,并加上你的贡献,我再补充我的。如此一来,创新的速度就不再仅仅是单个公司或工程团队的贡献,而是整个生态系统的合力。中国在开源工程方面的实践非常巧妙。
但别忘了,开源具有广泛的全球性影响。开源模型不仅帮助了中国的生态系统,也在帮助世界各地的生态系统。你们的 R1、Qwen 和 Kimi,是当今世界上最顶尖的开放式多模态推理模型。这说明它们非常先进。无论你是谁,是医疗健康公司、金融服务公司还是机器人公司,都可以利用这些成果,并根据自己的应用场景进行修改。
同样需要强调的是,开源是推动技术进步最安全的方式。“阳光是最好的消毒剂”。当你拥抱开源和开放式创新时,你就在主动接受全球科学界的审视。而有了全球科学界的审视,工作的质量自然会提高。如果你去读 DeepSeek 的论文,会发现它写得极为出色,是绝对顶级的科学研究和工程实践。他们完全以开放的方式进行,这既促进了教育、学习和分享,也得益于无数人的审视。因此,这对安全性大有裨益。
王坚:谢谢。顺便一提,DeepSeek 和 Qwen 都来自杭州。我本人就是杭州人,我为这座城市感到非常自豪。我在此个人正式邀请您,下次来华时访问杭州。
黄仁勋:杭州,我是否可以斗胆说,它是中国的硅谷?
王坚:我想我更愿意说,杭州将成为面向世界的创新中心,它有自己独特的魅力。再次向您发出我个人的邀请,期待您下次来访杭州。
黄仁勋:我一定会的,谢谢你。
AI对科学研究的影响
王坚:Jensen,我下一个问题可能有些难度,请见谅。我们知道,当今的 AI 技术在很大程度上依赖于硅基技术。它离不开硅。我们利用硅来提升算力,获取海量的存储空间,并实现令人难以置信的通信带宽。这一切都建立在硅之上。所以我想问您,在未来的 10 到 20 年里,AI 技术的发展是否还能继续依赖硅?
黄仁勋:当然可以。如今的硅基技术已经融合了许多不同的元素,早已不是纯粹的硅了。所以我认为我们会在多个相关领域继续取得突破。晶体管将实现三维化,我们称之为全环绕栅极。目前的技术是纳米片,下一代就是所谓的 Gate-All-Around。在此之后,我们将实现晶体管的垂直堆叠,即堆叠式。电源将不再仅仅分布于硅片的表面,而是从正反两面进行输送,我们称之为背面供电。
我们不再是处理单颗芯片,而是转向芯片堆叠和多芯片组件。因此,封装技术变得极为先进。我们称之为 CoWoS。NVIDIA 是第一家大规模应用 CoWoS 技术的公司。未来,封装的单位将不再是目前这样的小尺寸,而是整个面板。一个芯片系统的尺寸可能达到这张桌子的大小。更进一步,我们将采用直接贴合的硅光子技术,实现光子和电子之间极其紧密的耦合。我们称之为 CPO。然后我们就可以将许多这样的单元连接在一起。我们能够提升性能的维度之多,简直令人难以置信。
王坚:硅技术真是了不起。
黄仁勋:我们未来至少二十年都有充足的工作可做。我们之所以有这样的判断,是因为 NVIDIA 的技术路线图就已经规划了近十年。我们有一个至少五到十年的明确规划,并且已经在构想、设计和构建十年后的系统了。因此,我很确定我们能清晰地预见到未来十年的发展,而且在未来的二十年里,我坚信我们还有大量的工作要做。
王坚:我坚信,只要我们有好的架构…
黄仁勋:看来我们俩至少还要忙上二十年。
王坚:尤其是在拥有一个好架构的前提下。当好的架构与硅技术相结合,我们能做的事情就更多了。
黄仁勋:没错。
对年轻人的建议