原创 集智百科团队 2025-02-21 18:25 上海
计算力学以信息论和生物进化的思想为基础,是目前最早的对涌现的定量化研究。
导语
计算力学(Computational Mechanics)是一套用于量化涌现的框架。它以一种计算的视角,研究观察者建立的模型在识别涌现时,模型发生的变化。计算力学以信息论和生物进化的思想为基础,是目前最早的对涌现的定量化研究。在应用当中,该理论提出了对复杂性度量的新指标,即统计复杂度,同时还提出了一套识别涌现的算法。
为了系统梳理因果涌现最新进展,北京师范大学系统科学学院教授、集智俱乐部创始人张江老师领衔发起「因果涌现第六季」读书会,读书会将从2025年3月16日开始,每周日早9:00-11:00,持续时间预计10周左右。每周进行线上会议,与主讲人等社区成员当面交流,之后可以获得视频回放持续学习。诚挚邀请领域内研究者、寻求跨领域融合的研究者加入,共同探讨。
“集智百科精选”是一个长期专栏,持续为大家推送复杂性科学相关的基本概念和资源信息。作为集智俱乐部的开源科学项目,集智百科希望打造复杂性科学领域最全面的百科全书,欢迎对复杂性科学感兴趣、热爱知识整理和分享的朋友加入,文末可以扫码报名加入百科志愿者!
↑↑↑扫码直达百科词条
关键词:因果态理论,计算力学,因果涌现,因果态,统计复杂度,香农熵率,世界模型
刘易明、杨明哲 | 作者
目录
1. 历史渊源
2. 问题背景
2.1 自然和社会现象中的涌现
2.2 计算力学中的涌现
2.3 进化的系统模型
3. 因果态和复杂度
3.1 状态的定义
3.2 因果态的定义
3.2.1 划分
3.2.2 因果态
3.2.2.1 预测等价关系
3.2.2.2 因果态
3.2.2.3 举例说明
3.2.2.4 小结
3.3 因果态的主要性质
3.3.1 最大预测性
3.3.2 最小随机性
3.4 斑图重构机器
3.5 统计复杂度
3.5.1 柯氏复杂度的问题
3.5.2 统计复杂度
3.5.3 两种复杂性的对比
3.6 香农熵率与复杂度
3.7 模型重构
3.8 模型重构算法
4. 混沌动力学实例
4.1 逻辑斯谛映射
4.2 统计复杂度-熵率图
4.3 模型升级
5. 与相关研究的比较
5.1 计算力学与因果涌现
5.1.1 概念对比
5.1.2 斑图重构机器与NIS系列的对比
5.2 计算力学与马尔科夫链的成块性理论
5.3 斑图重构机器与世界模型
1. 历史渊源
计算力学源于 20 世纪 70 年代和 80 年代早期非线性物理学领域对流体力学领域湍流问题的研究。为了识别流体湍流中的混沌动力学,Packard和 Crutchfield等人开发了一套吸引子重构方法[1][2],使用测量的时间序列来重构流体动力系统的状态空间,可以在其中观察混沌吸引子并定量测量它们的不稳定程度及其伴随的复杂性。这套重构方法的有效性在 1983 年通过实验得到了验证[3],之后就被广泛用于识别和量化确定性混沌系统的行为。但是,这套方法无法简明扼要地表达被重构系统的内部结构。为了解决这个问题,计算力学理论应运而生。
计算力学的首次提出是在1989年,Crutchfield在他的一篇论文中[4],基于时间序列重构的状态空间[1] 和自动机理论[5][6][7]定义了一种预测等价关系。利用这种关系分析时间序列数据,识别和量化其中有规律的部分,计算力学就可以构建一个能够预测系统未来行为的模型。
计算力学的核心概念是因果态(Causal State),它是一种与微观状态预测等价的特殊的宏观态。基于这种预测等价性的宏观态划分思想可以追溯到70年代的马尔科夫链的成块性(Lumpability)理论。Kemeny和Snell在1969年针对马尔科夫链提出成块性这一概念,目的在于判断一个马尔科夫动力系统是否是可被简化归并的。对于任意一个马尔科夫链,我们可以判断某种划分是否是成块的。成块的划分要求对状态的归并要尽可能地保留马尔可夫链中的原始重要信息,并保证划分操作与动力学操作的可交换性。不过在马尔科夫链中,成块性只是对于划分的一种要求,而没有追求最优的划分。对成块性的进一步了解,请参考词条马尔科夫链的成块性。与之相比,计算力学首先关注的不只是马尔科夫动力学,而是要囊括更广泛的动力学形式。此外,计算力学试图提出一种最优的划分,能极大地保留对预测有用的信息。此外,当一般的动力学过程退化到马尔科夫动力学的时候,成块性的成立条件实际上与因果态的定义具有一定的相似性。
2. 问题背景
2.1 自然和社会现象中的涌现
有一些自然和社会现象非常引人入胜,但也很令人困惑,比如行为简单的蚂蚁可以形成复杂的社会,在没有控制中心的情况下自发产生特异化的社会分工[8]。在没有领导者引导的情况下成群的鸟以步调一致的队形飞行,成群的鱼以连贯的阵列游动,突然一起转向[9]。经济中商品的最佳定价似乎源于主体遵守局部的商业规则[10]。这些现象中的全局协调是如何出现的?是否有共同的机制引导着这些不同现象的出现?在复杂系统理论中把这类许多独立子系统相互作用后产生高度结构化的集体行为的现象称作涌现。
目前对涌现的研究理论有基于有效信息的因果涌现理论、基于信息分解的因果涌现理论、基于可逆性的因果涌现理论,基于转移熵的动力学解耦理论[11]、基于格兰杰因果的G-emergence理论[12]等等。计算力学是基于统计复杂度对涌现的定量化研究理论,它提出的时间最早,虽然对涌现的的研究方法与上述理论均不同,但有很多研究思路是相似的,它定义的统计复杂度、因果态、斑图重构机器等概念对涌现的研究有很大启发和借鉴意义。
2.2 计算力学中的涌现
什么是涌现?从直觉上来说,涌现现象就是系统出现了新的特征。但是什么是“新特征”呢?特征的新又“新”在哪里?所以,我们还需要更精确的语言对涌现的概念进行描述。涌现通常被理解为一个过程,该过程所产生的结构并不能直接由控制系统的定义所约束以及被瞬时力所描述。比如一堆随机运动的粒子,虽然它们受到的瞬时力可以用运动方程描述,但是从宏观尺度上却会表现出诸如压强、体积以及温度等新特征。我们需要引入斑图的概念来明确说明什么是新特征,否则涌现这一概念几乎没有内容,因为几乎任何时间依赖的系统都会表现出涌现特征。
在计算力学中[13],斑图通常指的是从时间序列中总结出的规律性结构。实际上,检测到的斑图通常是通过观察者选择的统计数据来隐含假定的,可能某些斑图的功能表现与其数学模型一致,但这些模型本身依赖于一系列理论假设。简而言之,斑图通常是被猜测出来的,观察者通过固定的规律库来预测这些结构,然后再进行验证。可以用通信信道做一个类比,观察者就像是一个已经手握密码本的接收者,任何未能通过密码本解码的信号本质上都是噪声,即观察者未能识别的斑图。
在系统内部的协调行为中,有一种斑图变得尤为重要,这种斑图会相对于该系统的其他结构显现其“新颖性”。由于没有外部的参照来定义这种新颖性,我们可以将这个过程称为内在涌现(Intrinsic Emergence)。比如在高效的资本市场中,主体根据从集体行为中涌现出的最优定价,调整其个人生产-投资和股票所有权策略[10]。对于主体的资源配置决策而言,通过市场的集体行为涌现出的价格是准确的信号,它完全反映了所有可用信息。内在涌现的独特之处在于系统形成的斑图赋予了系统额外的功能性,并支持全局信息处理,如设定最优价格等。更具体地说,内在涌现可以直接嵌入系统非线性计算过程之中,能够被系统直接利用,这样就赋予了系统额外的功能性。
总而言之,计算力学区分了三个概念:
对涌现的直觉定义:系统中出现任何可以被称为新颖的特征。
斑图涌现(Pattern Formation):观察者在系统中识别出的有规律的结构。
内在涌现(Intrinsic Emergence):系统本身捕捉并利用它自身出现的斑图。
2.3 进化的系统模型
我们可以从多智能体系统的视角来阐述内在涌现的问题[13],从而为一个高度有序的系统是怎么从混沌中涌现的提供一种可能的解释。但是该视角在解释生命形式的多样性方面依然能力有限。因此要将系统限制在一个结构和生物特征明确的确定性动力系统(Deterministic Dynamical Systems,简称DS)中,并把它简化为包括一个环境和一组适应性观察者或“智能体”的模型,这样才能清晰地定义智能体的性质。智能体(Agent)试图构建和维持一个对其环境具有最大预测能力的内部模型。每个智能体的环境是其他智能体的集合,可以被视为一个随机的动力系统(Stochastic Dynamical Systems,简称SDS)。在任何给定的时刻,智能体感知到的是当前环境状态的投影。随着时间的推移,感官装置产生一系列测量,这些测量引导智能体利用其可用资源(下图中的“基层”)来构建环境模型。基于环境模型捕捉到的规律,智能体可以通过效应器采取行动,最终改变环境状态。
上图为以智能体为中心的环境视图:宇宙可以被视为一个确定性动力系统,即使规则和初始条件是确定的,随着规模的增长,系统也会变得极为复杂。每个智能体所看到的环境是一个由所有其他智能体组成的随机动力系统。其随机性源于其内在的随机性和有限的计算资源。每个智能体本身也是一个随机动力系统,因为它可能会从其基层和环境刺激中采样或受到无法控制的随机性所困扰。基层代表了支持和限制信息处理、模型构建和决策的可用资源。箭头表示信息流入和流出智能体的方向。
智能体面临的基本问题是基于对环境状态的建模,来对未来环境进行预测。这需要一个量化的理论来描述智能体如何处理信息和构建模型。
3. 因果态和复杂度
智能体需要一种有效的描述方式处理所接受到的环境信息,使其可以把环境信息压缩成一个有限的状态空间,并存储于内部环境模型中。为了找到这种有效的描述方式,我们首先需要定义所谓的智能体状态的概念:状态可以被理解为智能体所接收到的全部历史信息,即历史信息即状态。之后,我们将引入"因果态"的概念,它相当于是对状态的一种粗粒化描述。下面给出正式定义:
3.1 状态的定义
智能体对环境的测量精度一般都是有限的,测量结果只能描述环境状态的某种投影。我们可以将环境从过去到未来的变化用一个离散的稳定随机过程描述,状态的取值空间则为双无限序列可数集合
基于当前的时刻
然后我们将定义一个叫做“因果态”的概念。
3.2 因果态的定义
3.2.1 划分
通过对状态空间进行划分(partition),智能体可以用一种更加粗糙的方式来描述同样的状态,这一过程也被人们叫做粗粒化。划分可以被理解为一种映射,
上图为某种划分的示意图[14],值得注意的是,
于是,智能体就需要学习到一种有效的划分,即如何从观测到的状态(可以称之为微观态)到智能体压缩后得到的隐空间上的状态(可以称为宏观态)能够很好对应,使得宏观态更加有效地反映微观态中的重要信息。那么,什么叫做有效呢?
3.2.2 因果态
对于集合
下面,我们给出因果态的形式化定义。
3.2.2.1 预测等价关系
对于任意时刻
也就是说,若
3.2.2.2 因果态
我们可以直接将因果态定义为一个从状态集到状态子集的映射,即
其中,
所有的因果态的集合,可以由预测等价关系"
3.2.2.3 举例说明
为了说明因果态的概念,我们绘制下面的示意图以举例说明:
如上图所示[13],左侧的数字代表
3.2.2.4 小结
内在计算(intrinsic computation)的核心思想是预测等价性[15],即系统的历史能够用来预测其未来行为的一种等价性。通过构建预测模型,内在计算能够识别系统中的结构,并量化这些结构的复杂性和稳定性。它可以让我们能够将自组织视为系统中规律性和规则性的涌现,而这些规律性和规则性是系统在特定的初始条件和外部驱动下自发形成的。内在计算的一个重要应用是在于理解从完全规则到完全无序之间组织结构的差异和过渡。比如,木星的大红斑是一个经典的自组织现象,其规模和稳定性无法通过流体力学方程的求解而获得直接解释。然而,内在计算能够通过分析该现象的历史数据,构建出一个能够准确预测其未来行为的模型,从而揭示出其背后的自组织机制。
3.3 因果态的主要性质
为什么我们要关注因果态这样一种特定的宏观态呢?下面是因果态的两个主要性质,能够体现出因果态是一种最理想的宏观态:
3.3.1 最大预测性
性质1(因果态具有最大预测性):对于宏观态
根据因果态的定义可知:
上式等价于
因为
所以
3.3.2 最小随机性
性质2(因果态具有最小随机性):设和
和
,都有
该性质可以被理解为在相同预测能力的前提下,因果态集合
用互信息的角度去理解的话,上式等价于
若想更深入的理解因果态的性质可以阅读Cosma Rohilla Shalizi 和James Crutchfield合写的一篇论文[14],里面有因果态更多的性质和对应的形式化证明过程。
3.4 斑图重构机器
前面给出了因果态的定义,接下来讨论一个智能体是如何从观测到的时间序列数据中,自动地发现因果态的问题。为了解决这个问题,计算力学建立了名为斑图重构机器(ϵ-machine)的模型,其中因果态所对应的划分映射被记为
其中: 代表未来序列的第一个符号,所以因果态
每个
3.5 统计复杂度
3.5.1 柯氏复杂度的问题
智能体在构建和优化斑图重构机器的过程中,由于计算资源的限制,不能无限制地增加模型的大小。因此我们需要一个能够量化模型复杂度的指标,以便监控和调整模型的大小,确保模型能匹配已有的计算资源。柯式复杂度
然而,柯式复杂度存在两个明显的问题,第一个问题是它的不可计算性,柯氏复杂度仅仅是一个理想化的概念;第二个问题是它可能无法度量程序的结构和动态特性。因为柯式复杂度
3.5.2 统计复杂度
为了解决这两个明显问题,计算力学提出了统计复杂度
这里,
这里,伯努利图灵机(Bernoulli-Turing machine,简称BTM)是一种概率性图灵机,是确定性图灵机的一种扩展。它通过引入随机数发生器,可以生成离散的随机序列。伯努利图灵机包含输入纸带、输出纸带、有限状态控制单元和工作纸带。在运行过程中,伯努利图灵机按照常规图灵机的方式读取纸带上的符号和自身的当前状态,并依据内置的规则表进行操作。与普通图灵机不同的是,其规则表中有一些可随机执行的规则,它会根据随机数发生器的采样结果来决定具体的执行路径。例如,在某个状态下,图灵机可能有两种可选的操作,普通图灵机根据确定的规则选择其中一种,而伯努利图灵机则通过随机源(即随机数发生器)以一定的概率来执行其中的某一种操作。
由于内部模型(ϵ-machine)作为一种伯努利图灵机,本身也是用字符串(因果态)来描述的,所以可以用长度、香农熵等指标来度量内部模型的复杂度。当我们使用香农熵来刻画内部模型的复杂度时,我们可以给出对于观测序列来说一个等价的可计算的定义[4]:
其中
统计复杂度的一个特征是,对于完全随机对象,有
3.5.3 两种复杂性的对比
下图展示了柯式复杂度和统计复杂度随着序列从简单周期性变为完全随机的过程中二者的差异。如图(a)所示,柯式复杂度会随着序列随机性的增加而单调递增。相反,统计复杂度在周期和随机两个极端点上均为零,并在中间达到最大值(见图(b))。这反映出如下的观点:随机性在统计上是简单的,一个完全随机的过程具有零统计复杂度;周期性在统计上也是简单的,一个完全是周期性的过程具有较低的统计复杂度。复杂过程是在这两个极端之间产生,并且是可预测机制和随机机制的混合,有中等程度随机性的数据具有最大的统计复杂度。
3.6 香农熵率与复杂度
上文中提到的一个序列的随机性可以用香农熵率(Shannon Entropy Rate)来度量,香农熵率是信息论中的一个概念,它是香农熵的扩展,主要用于描述时间序列在单位时间上的平均信息量。在这里,香农熵率可以定义为:
其中,
香农熵率是归一化的度量信息不确定性程度的指标,信息的不确定性越高,香农熵率越大。对于简单的周期性过程,如
香农熵率与柯式复杂度
上文中我们介绍了柯式复杂度、统计复杂度和香农熵率这三个与复杂性相关的指标,其实这三者之间存在一个近似关系,可以用公式表示为:
如果在已确定描述语言(程序)的情况下,柯式复杂度
3.7 模型重构
由于智能体的计算资源是有限的,当测量结果中的数据量超过模型能够处理的极限时,我们就需要构造模型,以更简洁地描述数据。这样做的目的是在保持计算资源不变的情况下,确保智能体仍然能够对外界进行有效的预测。这一过程可以反复迭代地进行,也就是说,因果态序列也可以被看做是原始状态序列,因此智能体可以在因果态基础上再次重构生成该因果态的模型。于是,这便形成了一系列不断升级的层级化的重构过程。
重构的方法主要是通过寻找原有模型中相似的状态组,从而形成因果态;然后,在已经识别出的因果态中,我们进一步抽象出更高层级的因果态组。这样,随着数据量的增大,我们就可以不断地在上一层级抽象出更高的层级,从而在计算资源有限的情况下,仍然能够应对更大量的数据。譬如,当智能体观测到“121212”时,会把“12”看成是一个模块,用一个字符“A”来表示,于是原本的微观态字符串就可以被重构为“AAA”这样的宏观态字符串,复杂度就降低了。而当模型进一步观测到更长的字符串是“12121231212123”时,它便需要跳出原本的分组,而把“1212123”看成是一个新的模块,可以用一个字符“B”来表示,于是内部模型可以进一步用“BB”这样的新字符串来表示同一个观测对象。这便是一次模型重构不断升级的过程。下表中列举了一种模型重构的可能途径:
上表为因果时间序列建模层级,展示了可能的前四个层级,每个层级根据其模型类别定义。但这个过程仅仅是一个示例,可以不止四个层级。模型本身由状态(圆圈或方块)和转移(标记箭头)组成,每个模型都有一个独特的起始状态,由一个双重圆圈表示。数据流本身是最低层级,通过将序列测量分组为重复子序列,从数据流中构建出深度为
考虑一个由
3.8 模型重构算法
上面介绍了斑图重构机器,是智能体识别因果态的一种方式。若结合模型重构的概念,我们可以给出斑图重构机器的完整定义:斑图重构机器(ϵ-machine)是能够用最少的计算资源对测量结果进行有限描述同时复杂度最小的模型。模型重构的算法步骤如下:
1. 在最低水平上,设定0级模型为描述数据本身,即
2. 从更低模型重构模型
3. 收集更多的数据,增大序列长度
4. 根据统计复杂度可计算的定义
5. 如果模型复杂度收敛,意味着算法已经重建好了一个合适的斑图重构机器,程序退出。
4. 混沌动力学实例
4.1 逻辑斯谛映射
接下来将演示如何将计算力学和模型重构算法应用于一个具体的实际案例[13]。这个案例是混沌动力学中的逻辑斯谛映射 (logistic map),作者特别展示了算法在周期倍增的混沌路径上的表现。用于重建模型的数据流来自逻辑斯谛映射的轨迹,该轨迹是通过迭代映射
上图为迭代函数
4.2 统计复杂度-熵率图
上图(a)为逻辑斯谛映射中统计复杂度
本图表现了两个重要特征。第一个特征是熵率的极值导致零复杂度,也就是说在
上图(b)为逻辑斯谛映射中在
4.3 模型升级
下面三张图[13]展示了模型重构升级进化的一种路径。(a),(b),(c)三张图分别对应了由低到高不同阶次的重构机器的状态转移图。图中的圆圈代表状态,连边代表状态之间的转移,连边上的数字代表一次伯努利过程采样的0或1。
上图(a)为逻辑斯谛映射在
图(b)中的字符串操作可以通过将 A 的内容副本附加到 B 上,并用 B 的内容的两个副本替换 A 的内容来描述。这些字符串在方块处迭代,迭代式表示为
5. 与相关研究的比较
5.1 计算力学与因果涌现
5.1.1 概念对比
计算力学的许多概念上都可以在因果涌现理论框架下找到对应,通过进行两者之间的对应和比较,我们可以拓展对涌现的理解和研究。
计算力学和因果涌现的概念对比
5.1.2 斑图重构机器与NIS系列的对比
计算力学中的斑图重构机器(ϵ-machine)和识别因果涌现的NIS和NIS+都可以理解为是智能体观察外部世界的内部模型。斑图重构机器通过重构算法得到理想的划分和因果态的过程,与NIS或NIS+通过最大化宏观动力学的有效信息(Effective information,EI)得到最佳粗粒化策略与涌现的宏观动力学的过程是类似的。可以说,NIS或NIS+就是一个通过神经网络、机器学习技术实现的斑图重构机器(ϵ-machine)。
二者的等价可以体现在两方面:一方面我们希望重构的模型应该足够简洁(因果态具有最小随机性,NIS+中最大化宏观的EI);另一方面则希望宏观模型仍保留微观态变化的重要信息,有能力预测未来的微观态。
计算力学中,因果态的定义保证了它对微观态具有最大预测性,而香农熵率便可以衡量该预测误差的大小。在NIS或NIS+中,有效信息的最大化保证了模型的简洁性,而微观态预测误差的约束则体现了模型准确性的要求。
另外,我们在前文讨论了统计复杂度关于熵率的变化曲线,该图说明,涌现发生在随机性程度中等的情形下。而在NIS+的框架中,我们用机器的重构预测误差来约束模型,要求其在保证对微观预测尽可能准确(误差低于一定阈值)的前提下,最大化宏观的EI。此时,我们也可以计算宏微观的EI以及它们的差值来判断是否发生因果涌现。如下图所示,最高强度的因果涌现也发生在观测噪音处于中等强度时。
上图中,左图是前文中出现过的示意图。它描述了统计复杂度与数据随机性之间的关系,其中随机性通过香农熵率来度量(见前文中的实验部分)。当随机性处于中等强度时,统计复杂度出现峰值。右图来自NIS+应用在SIR(病毒感染动力学)为模型的生成数据上的实验。其中横轴为该数据中观测噪音的强度,纵轴为因果涌现强度
右图中,
5.2 计算力学与马尔科夫链的成块性理论
马尔科夫链是计算力学的一类特殊情形,即当未来状态仅依赖于上一步历史的情形。在马尔科夫链中,人们很早就开始讨论马尔科夫链的成块性(lumpability),所谓的成块性是一种描述马尔科夫链的状态是否可聚类并约简的性质。判断一个马尔科夫链上的划分是否是成块的(lumpable),是看它的马尔科夫状态转移矩阵
判断一个马尔科夫链对给定划分
其中,
另一方面,在讨论因果态的时候,我们也有类似的条件。对于某个划分得到的宏观态集合
其中。
如果将马尔科夫链的状态分组就看作是因果态理论中的粗粒化划分,那么成块性的要求和因果态的要求非常相似,它们都给出了一种对未来状态做预测的等价性。但是,二者又有区别,区别有以下三点:
1. 马尔可夫性假设
因果态并没有马尔科夫性的假设,但我们总可以把一个序列看成是一个状态,于是就能得到序列映射到序列的马尔科夫转移矩阵。在该概率转移矩阵上,我们可以比较因果态对应的划分映射和满足成块性的划分。
2. 微观和宏观最大预测性
上文提到,因果态的状态划分方式能保持微观层面上的最大预测性。也就是说,我们根据微观状态找到对应的因果态之后,即使我们不知道原本的微观状态了,我们还是能准确的得到未来的微观状态的分布。
而成块性与其不同的是,我们根据微观状态找到对应的宏观状态之后,能够准确的得到未来的宏观状态的分布。但是在粗粒化过程中,我们会丢失微观状态的辨别信息,而这个信息的损失是不可逆的。所以,我们就无法从宏观状态再还原到微观状态了。
所以,因果态同时保持了微观和宏观的最大预测性,而成块性只能保持宏观的最大预测性。
3. 因果态比成块性更严格,划分的成块性是满足因果态要求的必要条件
按照上面的叙述,我们会发现,因果态是比成块性更严格的限制,因为它要求在状态转移矩阵中,属于同一个因果态中的状态的行必须完全一致。
因果态的划分一定是一种成块的状态划分,但反之则不一定。所以说,划分的成块性是满足因果态要求的必要不充分条件。
二者之间的区别也可以用下图进行直观表示:
该图展示了我们是怎么处理和理解因果态和成块性的。首先,我们把每条序列看作是一个状态,把序列压缩到了一个
在因果态中,我们只需要对比转移矩阵的行,把相同的行划分成一组;而在成块性中,我们需要同时考虑矩阵的行与列,通过比较每一行到某几列的转移概率来做分组。
5.3 斑图重构机器与世界模型
计算力学中的斑图重构机器关心智能体是如何从观测到的时间序列数据中自动地发现因果态,并构建内在的环境模型的,这一点与强化学习领域中的世界模型(也被称为以及模型的强化学习)的想法不谋而合。
强化学习所解决的问题通常可以建模为马尔可夫决策过程(Markov Decision Process,缩写MDP),形式上可表示为
在强化学习世界模型中,智能体根据和真实环境互动过程所产生的数据训练一个内嵌的世界模型,世界模型作为对真实环境的替代,从而可以通过和世界模型互动学习行动策略,减少和真实环境的互动。对于观测不包含完整的状态信息的POMDP问题,以及观测维度过高导致难以准确建模的MDP问题,人们通常让Agent去学习一个状态的粗粒化表征,这种方式可以帮助算法提升学习效率和任务表现。这种粗粒化表征就是所谓的“世界模型”。
因此,强化学习的世界模型往往需要学习一个低维的隐状态动力学。隐状态的世界模型可以表示为
世界模型与计算力学中斑图重构机器存在几点差异:
1. 强化学习世界模型中的状态转移包含动作,而在斑图重构机器中建模因果态的转移,不涉及智能体动作的建模。
2. 在世界模型的学习中,宏观状态粗粒化的另一个需要考虑的点是状态转移和粗粒化的可交换性,也就是从
作者简介:
本词条由集智俱乐部众包生产,难免存在纰漏和问题,欢迎大家留言反馈或者前往对应的百科词条页面进行修改,一经修改,可以获得对应的积分奖励噢!
加入我们
亲爱的社区成员和知识爱好者:
我们正在寻找对知识分享充满热情的志愿者,加入我们的集智百科词条编写团队!无论你是某个领域的专家,还是对某一主题有浓厚兴趣,我们都欢迎你的加入。通过编写和编辑百科词条,你将有机会为全球读者提供准确、权威的信息,同时提升自己的写作和研究能力。
我们需要的帮助
编写新的集智百科词条,涵盖复杂系统、人工智能等多个领域
更新和完善现有词条,确保信息的准确性和时效性
校对和审核其他志愿者提交的内容,确保词条质量
我们希望你具备
良好的写作能力,能够清晰、简洁地表达复杂的概念
对某一领域有深入了解或浓厚兴趣
具备基本的网络搜索和信息整理能力
有责任心和团队合作精神,愿意为知识共享贡献力量
如果你对知识分享充满热情,愿意为全球读者提供有价值的信息,请立即加入我们!
扫码填表,添加负责人微信
让我们一起,用知识连接世界!
参考文献
Packard, N. H.; Crutchfield, J. P.; Farmer, J. D.; Shaw, R. S. (1980). "Geometry from a time series". Physical Review Letters. 45 (9): 712.
Takens, D. A. (1981). Detecting strange attractors in fluid turbulence. 898. Berlin: Springer-Verlag. pp. 366.
Brandstater, A.; Swift, J.; Swinney, Harry L.; Wolf, A.; Farmer, J. D.; Jen, E.; Crutchfield, J. P. (1983). "Low - dimensional chaos in a hydrodynamic system". Physical Review Letters. 51 (16): 1442.
Crutchfield, James P.; Young, Karl (1989). "Inferring Statistical Complexity". Physical Review Letters. 63 (2): 105–108.
Minsky, M. (1967). Computation: Finite and Infinite Machines. Englewood Cliffs, New Jersey: Prentice - Hall.
Chomsky, N. (1956). "Three models for the description of language". IRE Transactions on Information Theory. 2: 113–124.
Hopcroft, J. E.; Ullman, J. D. (1979). Introduction to Automata Theory, Languages, and Computation. Reading: Addison - Wesley.
Holldobler, B.; Wilson, E. O. (1990). The Ants. Cambridge, Massachusetts: Belknap Press of Harvard University Press.
Reynolds, C. W. (1987). "Flocks, herds, and schools: A distributed behavioral model". Computer Graphics. 21: 25–34.
Fama, E. F. (1991). "Efficient capital markets II". Journal of Finance. 46: 1575–1617.
Barnett, L.; Seth, A.K. (2023). "Dynamical independence: discovering emergent macroscopic processes in complex dynamical systems". Physical Review E. 108 (1): 014304.
Seth, A. K. (2008). "Measuring emergence via nonlinear granger". Artificial Life XI: Proceedings of the Eleventh International Conference on the Synthesis and Simulation of Living Systems. 2008: 545–552.
Crutchfield, James P. (1994). "The Calculi of Emergence: Computation, Dynamics, and Induction". Physica D: Nonlinear Phenomena. 75: 11–54.
Shalizi, C. R.; Crutchfield, J. P. (2001). "Computational Mechanics: Pattern and Prediction, Structure and Simplicity". Journal of Statistical Physics. 104 (3/4): 817–879.
Rupe, Adam; Crutchfield, James P. (2024). "On principles of emergent organization". Physics Reports. 1071: 1–47.
Bennett, C. H. (1988). Pines, D. (ed.). "Dissipation, information, computational complexity, and the definition of organization". Emerging Syntheses in the Sciences. Redwood City: Addison-Wesley.
(参考文献可上下滑动查看)
因果涌现读书会第六季
在霓虹灯的闪烁、蚁群的精密协作、人类意识的诞生中,隐藏着微观与宏观之间深刻的因果关联——这些看似简单的个体行为,如何跨越尺度,涌现出令人惊叹的复杂现象?因果涌现理论为我们揭示了答案:复杂系统的宏观特征无法通过微观元素的简单叠加解释,而是源于多尺度动态交互中涌现的因果结构。从奇异值分解(SVD)驱动的动态可逆性分析,到因果抽象与信息分解的量化工具,研究者们正逐步构建起一套跨越数学、物理与信息科学的理论框架,试图解码复杂系统的“涌现密码”。
为了系统梳理因果涌现最新进展,北京师范大学系统科学学院教授、集智俱乐部创始人张江老师领衔发起「因果涌现第六季」读书会,组织对本话题感兴趣的朋友,深入研读相关文献,激发科研灵感。
读书会将从2025年3月16日开始,每周日早9:00-11:00,持续时间预计10周左右。每周进行线上会议,与主讲人等社区成员当面交流,之后可以获得视频回放持续学习。诚挚邀请领域内研究者、寻求跨领域融合的研究者加入,共同探讨。
推荐阅读
4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程
6. 加入集智,一起复杂!
点击“阅读原文”,报名读书会