--- 本周为您解读 ③ 个值得细品的 AI & Robotics 业内要事 ---
1. 实现 Agent 能力的泛化 ,是否一定需要对世界表征?
通用智能体绕不开对世界的表征?「无模型」的范式价值何在?有哪些关于世界模型必要性的非共识?流行的世界模型范式都有什么通病?以 JEPA 为代表的建模主张有何缺陷?...
2. 技术狂飙下的 AI Assistant,离真正的 Jarvis 还有几层窗户纸?
为什么说当前大多数 AI Assistant 仍停留在「对话器」阶段?它们距离真正的「通用行动体」还差什么?通用型与场景型 AI Assistant 哪种更有前景?「做深一个场景」是否能跑出下一个突破口?Cross-Attention 与 MoE 架构如何帮助 AI Assistant 降低语音交互的延迟?AI Assistant 如何成为企业的新盈利入口?它真的能带来「增量流量」吗?未来的 AI Assistant,会成为「第二手机」还是「个人操作系统」?...
3. OpenAI 前产品 VP 的「世界级产品经理心法」了解一下?
Peter Deng 为何被称为「产品之神」?如何解释「产品本身不重要」?「产品品味」为什么是企业的护城河?Peter Deng 如何评价现在的 AI 产品?做出爆款产品的「超级团队」有什么特征?不同的团队的产品经理需要什么特质?...
通用智能体绕不开对世界的表征?1、现代的 AI 智能体被定义为能够感知环境、自主采取行动以实现目标,并通过学习或获取知识来提升其性能的实体。其自主性与仅能响应预设规则的“机器人”(bots)的本质区别在于“泛化能力”的存在与否。[1-1]① 人们期待智能体能够独立地进行推理、规划、记忆和决策,以完成复杂的、多步骤的任务,进而实现「通用智能体」2、相较于 AI,人类拥所具备的灵活的目标导向行为依赖于对世界丰富心理表征,用于设定超越即时感官输入的抽象目标,并进行深思熟虑和主动的行动规划,但学界关于智能体是否需要一个内部世界表征(即“世界模型”)的争论,构成了两条截然不同的思想脉络,即「无模型范式」和「基于模型的范式」。3、追求绕过表征的无模型范式(The Model-Free Paradigm)认为,智能行为可以通过智能体与环境之间直接的“感知-行动”循环(action-perception loops)涌现,无需构建关于世界如何运作的显式内部表征或模型。[1-2]① 该工作指出,当以渐进的方式实现智能,严格依赖于通过感知和行动与现实世界的交互时,对表征的依赖就会消失。这种方法旨在绕过学习世界模型所固有的复杂性,被视为一条通往通用人工智能的“无模型捷径”(model-free shortcut)。4、另一种基于模型的范式(The Model-Based Paradigm)植根于认知科学,认为灵活的、目标导向的行为在很大程度上依赖于对世界丰富的内部预测性表征,智能体若要超越简单的反应,就必须内化一个关于世界如何运作的模拟器,即“世界模型”(World Model)。5、DeepMind 的研究者在近期的论文中形式化地探究了“无模型”方法与“基于模型”(model-based)方法的争论,并通过实验证明,具有泛化能力的智能体必然内化了对世界的表征,进而证明了对世界表征的必要性。[1-3]① 该工作构建了一个严谨的数学框架,其将环境定义为一个完全可观测的马尔可夫过程,并将“通用智能体”定义为:能够在一系列多样化的、简单的、目标导向的任务中满足较低“遗憾”(regret)界限的目标条件策略。② 基于上述定义,该工作证明了一个核心定理,即对于任何满足上述条件的通用智能体,我们都可以仅从其策略本身恢复出环境转移函数的一个近似模型(即一个世界模型)。③ 换言之,该工作证明了智能体想获得“通用、长程”能力,无法绕开高质量世界模型;看似绕过表征的方法实则隐式地学到了世界模型。6、值得注意的是,DeepMind 的工作还区分了短视行为和长远规划,并通过实验表明,对于只关心下一步即时回报的短视智能体(myopic agents),世界模型并非必需。① 一个短视智能体只需知道哪个行动能立即带来最好的结果,而无需模拟一连串的事件。然而,一个需要进行长远规划的通用智能体,则必须比较不同初始行动所引发的整个未来轨迹的优劣。
充满非共识,多样化的世界表征方法是殊途同归还是南辕北辙?[1-4]DeepMind 的工作将“是否需要表征?”的理论争议转向了“如何表征?”的实践讨论。当前 AI 领域已涌现出多种构建世界模型以表征世界。然而,现有的世界模型范式并非完美无缺,且在不同层面上存在非共识。