机器之心 2024年12月07日
智能体模拟《西部世界》一样的社会,复旦大学等出了篇系统综述
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

该综述文章系统性地回顾了大语言模型(LLMs)驱动的智能体在社会模拟中的应用。文章指出,传统社会学研究方法存在成本高、规模化困难和道德风险等问题,而LLMs凭借其强大的推理和规划能力,为模拟人类行为提供了新机遇。文章将现有研究分为个体模拟、场景模拟和社会模拟三类,并详细阐述了每一类的架构、构建方法、应用场景和评估方法,并探讨了其发展趋势,旨在推动该领域的进一步发展,同时为跨学科研究提供支持。

🧍‍个体模拟:利用LLM智能体模拟特定个体或群体,侧重于对单个人的特征复制。文章提出了一个包含智能体架构、构建方法、模拟对象和评估方法的系统化框架,以指导个体模拟的设计与应用。

🎯场景模拟:在一个集中的场景中组织多个智能体,由特定目标或任务驱动。文章归纳了场景模拟的四个核心要素:环境、角色、组织和通信,并将其应用于对话驱动场景和任务驱动场景。

🏘️社会模拟:模拟智能体社会中更复杂多样的行为,探索现实世界应用中的社会动态。文章从社会构建元素、场景类型和评估方法三个方面总结了社会模拟的研究,并将其应用于广义经济学、社会学与政治学以及在线平台等领域。

📈发展趋势:文章指出,个体模拟经历了粗略模拟、精细模拟和面向情境模拟三个阶段;场景模拟经历了简单场景、多阶段场景和合作场景模拟三个阶段;社会模拟经历了构建模拟环境、探索特定场景的对齐以及扩展规模和模态三个阶段。

🔍评估方法: 文章总结了个体模拟、场景模拟、社会模拟的评估方法,包括微观层级、宏观层级和系统层级,以及静态评估和交互评估两类,涉及自动评估、基于LLMs的评估和人工评估等方法。

2024-12-06 17:01 北京

该研究旨在推动这一领域的进一步发展,同时为跨学科研究提供支持。

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com


引言


传统社会学研究依赖问卷调查和心理实验等方法收集数据,尽管真实可靠,但成本高、难以规模化且存在道德风险。近年来,大语言模型(LLMs)凭借强大的推理和规划能力,为模拟人类行为提供了新的机遇。通过角色扮演,LLMs 驱动的智能体能模拟特定情境下的个体反应,成为研究人类行为的有效工具。


与此同时,多智能体的交互被广泛用于解决问题和模拟复杂动态。LLMs 可被定制为具备特定知识和技能的智能体,通过协作实现目标、完成任务;它们的简单互动也能涌现复杂集体行为,模拟现实中的复杂社会动态。这些模拟为对社会现象的理解与预测提供了新工具,也为政策制定和社会管理提供了支持。


图 1:大模型智能体驱动的社会模拟概览。本文将现有工作分为个体模拟、场景模拟和社会模拟。从左到右,对个体建模的多样性和规模逐渐增加,从右到左,对个体建模的精确性需求增加。


目前,这一领域发展迅速,但现有综述多聚焦于单智能体的架构、特定能力或多智能体系统的某些方面,尚缺乏从个体到社会模拟的系统性回顾。因此,本文试图填补这一空白,为该领域提供全面的概述。考虑到模拟目标以及个体建模在精确性、多样性和规模上的不同需求,本文将现有工作归纳为三种类型:



这三类模拟呈现出递进关系:个体模拟为场景模拟和社会模拟奠定基础,而社会模拟则有潜力构建由无数场景组成的复杂世界。本文依次总结了三类模拟的研究进展,并探讨它们的发展趋势,旨在推动这一领域的进一步发展,同时为跨学科研究提供支持。




个体模拟


个体模拟基于模块化的体系结构,利用特定人物或人群的个性化数据,以高保真度为目标模拟这些对象。本文提出了一个系统化的框架来整理和概括个体模拟的相关工作,从整体上系统地分析和指导个体模拟的设计与应用,通过将智能体的基本架构与个体模拟的特点相结合,这个框架包含:智能体架构、构建方法、模拟对象和评估方法。


图 2: 大模型驱动的智能体个体模拟示意图。个体智能体通常由一个具有概要、记忆、规划和行动模块的框架组成,以模拟特定目标,如人物个体或人群个体。个体模拟可以通过静态和交互的方式进行评估,并观察不同的维度。


智能体架构


有效地模拟个体需要构建一个能够准确再现个体特征的智能体架构。通常,这种架构被模块化为四个核心组件:概要、记忆、规划和行动。



详细论述请读者参阅原论文 Section 3.1,以及表格 1 中对现有代表性工作架构组件的总结。


构建方法


个体模拟旨在将个体数据整合到 LLMs 中,以实现智能体与个体的对齐,进而模拟个体行为。构建方法分为两种类型:非参数化提示和参数化训练。



详细论述请读者参阅原论文 Section 3.2,以及表格 1 中对现有代表性工作构建方法的总结。


模拟对象


应用场景和目标的不同会影响模拟对象的尺度和粒度。根据模拟的范围和细节,模拟对象可分为人群个体和人物个体两类:



详细论述请读者参阅原论文 Section 3.3,以及表格 1 中对现有代表性工作模拟对象的总结。


评估方法


个体模拟的评估方法可以分为静态评估和交互评估两类。



详细论述请读者参阅原论文 Section 3.4


场景模拟


现实世界中,个体不是独立存在的,而是通过合作完成特定任务。场景模拟将一组智能体组织在一个具体场景中,由特定目标或任务驱动其行为。场景模拟通常从设计多智能体系统入手,包括构建环境、建模角色、以及设定组织结构与通信协议,以便有效管理智能体之间的互动。


图 3:场景模拟示意图。在给定特定场景的情况下,构建一个多智能体系统涉及对环境、角色、组织和通信进行建模。场景模拟完成后,通过不同的评估层次和策略进行评估。


组成要素


随着场景模拟的日益复杂,构建一个能够适用于多场景的统一系统框架尤为重要。现有系统的基本形式可以总结为:“通过受限的通信方式,将智能体组织起来,在特定环境中扮演角色”。基于这一框架,我们归纳了场景模拟的四个核心要素:环境、角色、组织和通信



详细论述请读者参阅原论文 Section 4.1,以及表格 2 中对现有代表性工作组成要素的总结。


场景分类


通过利用具备专业知识的智能体的集体能力,场景模拟已广泛应用于多个领域。在此,我们将不同的场景分为两大类:对话驱动场景,涵盖社会互动和问答任务;以及以任务驱动场景,聚焦于特定领域的专业任务。



详细论述请读者参阅原论文 Section 4.2,以及表格 2 中对现有代表性工作场景分类的总结。


评估方法


在场景模拟中,评估的重点是任务的解决效果。根据评估的范围,可以将其分为任务评估、子任务评估和系统评估,每种评估方法都采用不同的自动化评估、基于大语言模型的评估和人工评估方法来衡量性能。



详细论述请读者参阅原论文 Section 4.3


社会模拟


社会比单个场景更加复杂,其复杂性体现在组成的多样性、结构的多元性以及非线性效应等多个方面。社会模拟并不以解决具体任务或问题为目标,而是分析和解释大量智能体之间互动所产生的涌现行为及其结果。本文从社会构建元素、场景类型和评估方法三个方面总结了社会模拟的工作。


图 4:社会模拟示意图。构建社会模拟,需要对社会构成、网络、社会影响和结果进行设计。基于此,可以模拟各种场景,并在微观、宏观和系统层级进行评估。


社会构建元素


考虑到社会的复杂性,社会模拟的一个主要挑战是弥合个体和社会尺度之间的差距。为此,我们结合社会科学中的一些关键概念,总结提炼出了社会模拟中的 4 个核心元素:组成、网络、社会影响和结果



详细论述请读者参阅原论文 Section 5.1,以及表格 3 中对现有代表性工作社会构建元素的总结。


场景分类


社会模拟已广泛应用于与人类社会相关的各类场景,现有研究主要分为三个领域:广义经济学、社会学与政治学以及在线平台。



详细论述请读者参阅原论文 Section 5.2,以及表格 3 中对现有代表性工作的场景分类。


评估方法


社会模拟的评估主要集中在将模拟结果与现实数据进行比较,评估主要包括微观层级、宏观层级和系统层级



详细论述请读者参阅原论文 Section 5.3


研究趋势


个体模拟


图 5:个体模拟趋势示意图,包括粗略模拟、精细模拟和面向情境模拟。


个体模拟经过了三个阶段的演变,分别是粗略模拟、精细模拟和面向情境模拟,如图 5 所示。从 2022 年 6 月起,研究者开始关注粗略模拟,尤其是测试 LLMs 的个性和模拟知名角色等表面特征。到 2023 年 8 月,趋势转向更加精细的个体模拟,研究评估模拟模型的认知方面并提高其模拟能力。到 2024 年 4 月,研究者开始在特定场景中进行个体模拟,进一步扩展了模拟的复杂性和现实性。


场景模拟


图 6:场景模拟趋势示意图,包括简单场景、多阶段场景和合作场景模拟。


场景模拟的发展经历了三个明显的阶段,包括简单场景、多阶段场景、合作场景模拟。从 2023 年 1 月起,研究主要集中在简单场景上,涉及单一目标并促进基本的情境互动。到 2023 年 6 月,研究重点转向多阶段场景,加入了多步骤任务,使智能体能够在不同的情境中进行顺序决策和适应性反应,以实现更复杂的目标。到了 2024 年 2 月,研究逐渐聚焦于多智能体协作场景,强调智能体在复杂的高阶模拟中合作和适应的能力。


社会模拟


图 7:社会模拟趋势示意图,包括构建模拟环境、探索特定场景的对齐,以及扩展规模和模态。


社会模拟的发展可以分为三个阶段。2023 年 6 月起,研究集中在构建初步的模拟环境。在此阶段,研究者主要关注模拟环境的搭建与智能体在环境中基本社交能力(如记忆、对话、简单工具调用等)的实现。到 2024 年 2 月左右,研究重点转向了特定场景下的对齐,特别是聚焦于个性化建模和特定场景中的一些可观察和评测任务,推动了模拟精度和智能体对环境适应能力的提升。2024 年 2 月以来,随着技术迭代和智能体模拟精度的提升,研究逐渐转向了大规模模拟,研究者们在该场景下验证了一些人类社会已有的规律(如马太效应、帕累托法则等),进一步讨论了智能体社会与真实世界的一致性。与此同时,现实生活中的更多模态元素(如视觉、声音等)也被纳入模拟,强化了模拟的真实感和互动性,使得智能体的行为可以更加贴近现实情境。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

大语言模型 社会模拟 个体模拟 场景模拟 人工智能
相关文章