集智俱乐部 10小时前
多智能体强化学习:从单智能体到 LLM-Agents 的演进丨「大模型时代下的Agent建模与仿真」读书会·周二直播
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

集智俱乐部发起「大模型时代下的Agent建模与仿真」读书会,由多位知名学者共同参与,旨在深入探讨Agent建模与仿真的前沿技术。本期分享聚焦强化学习从单智能体到多智能体,再到融合大语言模型的进化路径,解析核心原理、挑战与未来范式。活动将帮助参与者梳理Agent建模与仿真的发展脉络,掌握基于多主体强化学习的复杂系统优化方法,并领略前沿学者的研究体系,共同畅想大模型时代人工社会的未来图景。

🎯 **强化学习基础与深度策略优化**:读书会将系统梳理强化学习(RL)从单智能体到深度强化学习(Deep RL)的核心原理,解析状态、动作、奖励等基本概念,并深入剖析DQN、PPO等典型算法的构建流程,以搭建对强化学习系统的基础认知。重点关注深度强化学习在组合优化问题求解中的实践应用,为理解智能体决策过程奠定基础。

🤝 **多智能体强化学习范式演进**:深入探讨多智能体强化学习(MARL)的演进,从独立学习到群体协同的策略博弈建模。会议将分析MARL面临的非平稳性、信用分配等核心挑战,并解析Independent Q-Learning到CTDE框架下的VDN、QMIX、MADDPG、MAPPO等主流模型机制,回顾其在复杂博弈与协作任务中的经典应用,展现从单体智能到群体智能的转变。

🧠 **融合大语言模型的多智能体建构**:重点介绍大语言模型(LLMs)如何与多智能体系统融合,形成LLM-Agents新范式。分享将解析LLM引入的三类路径:作为状态嵌入器、策略生成器和通信引擎,以及如何构建语言协同智能体,实现“语言即策略”。展望LLM-Agents作为通用型协作智能体架构的潜力,重塑群体智能与复杂系统建模。

🌐 **Agent建模与仿真的未来展望**:读书会将探讨Agent建模与仿真在大模型时代将为复杂系统理论带来的突破,以及大模型如何赋能Agent实现自主思考和动态适应。同时,还将深入研究大模型驱动的Agent交互可能涌现的新型社会现象,并探讨其在金融、心理、管理、军事等领域的应用前景,为理解和预测未来人工社会提供洞见。

2025-07-20 22:53 河南

7月22日(周二)晚上19:30-21:30直播

导语


集智俱乐部联合山东工商学院副教授高德华、天津大学教授薛霄、北京师范大学教授张江、国防科技大学博士研究生曾利共同发起「大模型时代下的Agent建模与仿真」读书会。读书会自2025年7月8日开始,预计持续分享8周左右。扫码加入Agent建模与仿真的前沿探索之旅,一起共学、共创、共建、共享「大模型时代下的Agent建模与仿真」社区,共同畅想大模型时代人工社会的未来图景!

本周是读书会的第三期分享,曾利博士将围绕强化学习从单智能体到深度策略优化的核心原理,解析状态、动作等概念及 DQN、PPO 等算法构建;深入多智能体强化学习范式,剖析非平稳性等挑战与主流模型机制;探讨融合大语言模型的多智能体建构,解析 LLM 引入路径与未来范式,展现从基础到前沿的技术演进与应用实践。


分享背景


强化学习(Reinforcement Learning, RL)作为人工智能中建模“智能体-环境交互”的核心范式,近年来已在众多复杂系统中展现出惊人的性能。随着深度神经网络与计算资源的发展,RL已从传统的表格型方法迈向深度强化学习(Deep RL)阶段,极大拓展了其在高维状态空间下的泛化能力与实用性。

在此基础上,多智能体强化学习(Multi-Agent Reinforcement Learning, MARL)应运而生,成为应对多方博弈、群体协作与复杂机制设计等问题的关键技术路径。近年来,MARL在多个领域取得了令人瞩目的成果:它不仅推动了《星际争霸II》、《德州扑克》、《陆军棋》等复杂博弈中超越人类的AI系统诞生,也在经济政策优化、仿人足球、多机器人协作、语言涌现与社会行为建模等任务中实现重大突破,成为连接智能体学习与群体智能的核心桥梁。强化学习也因此从单体智能迈向群体智能,从控制优化工具演化为“社会建模引擎”。

与此同时,大语言模型(Large Language Models, LLMs)的崛起,为构建具备推理、协作与语言能力的认知智能体提供了前所未有的技术基础。LLMs不仅能以自然语言感知环境、表达意图,更能作为策略生成器、通信协议或行为控制器嵌入强化学习体系中,成为多智能体系统中的“语言中枢”与“知识内核”。基于此,融合MARL与LLMs的认知型智能体系统,正逐步形成新的研究范式,为人工智能的泛化能力、交互能力与社会适应能力打开新局面。


分享简介


本次分享将围绕“单智能体强化学习 - 多智能体强化学习 - 大语言模型”这一技术进化路径,系统讲解从单智能体强化学习到多智能体协同的机制构建,再到融合语言模型的前沿探索,帮助您全面理解当代智能体系统的发展逻辑与未来趋势。


分享大纲


 

一、强化学习基础框架:从单智能体到深度策略优化的核心原理梳理

二、多智能体强化学习范式演进:从独立学习到群体协同的策略博弈建模

三、融合大语言模型的多智能体智能体建构:LLM-Agents范式的兴起与技术逻辑


核心术语



参考文献


 


主讲人介绍



曾利,国防科技大学系统工程学院二年级在读博士,立理AI联合创始人。本硕博均就读于国防科技大学,在Nature Machine Intelligence、ICDM、CIKM、科研管理等会议和期刊上发表学术论文30余篇。

研究方向:复杂网络、强化学习、组合优化、大语言模型等


参与方式


参与时间

2025年7月22日(周二)晚上19:30-21:30

报名加入社群交流

https://pattern.swarma.org/study_group_issue/923?from=wechat

扫码参与「大模型时代下的Agent建模与仿真」读书会,,加入社群,获取系列读书会永久回看权限,与社区的一线科研工作者沟通交流,共同大模型时代的未来人工社会图景。

「大模型时代下的Agent建模与仿真」读书会

集智俱乐部联合山东工商学院副教授高德华、天津大学教授薛霄、北京师范大学教授张江、国防科技大学博士研究生曾利共同发起「大模型时代下的Agent建模与仿真」读书会。读书会自2025年7月8日开始,每周二晚上7:30-9:30进行,预计持续分享8周左右。扫码加入Agent建模与仿真的前沿探索之旅,一起共学、共创、共建、共享「大模型时代下的Agent建模与仿真」社区,共同畅想大模型时代人工社会的未来图景!

核心问题

Agent建模与仿真是什么,核心技术发生了怎样的演变?

大模型时代,Agent建模与仿真会给复杂系统理论带来哪些突破?

大模型如何赋能Agent实现自主思考与动态适应?

大模型驱动的Agent交互会涌现出什么新型的社会现象?

Agent建模与仿真如何改变金融、心理、管理、军事等领域的研究范式?


你将收获

梳理Agent建模与仿真的历史发展脉络与方法论;

掌握一套理解、分析、控制、预测复杂系统的计算实验框架;

掌握基于多主体强化学习的复杂系统优化方法;

领略领域前沿学者的研究体系与科研路径。

详情请见:大模型时代下的Agent建模与仿真:共探人工社会未来图景

点击“阅读原文”,报名读书会

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Agent建模与仿真 强化学习 多智能体强化学习 大语言模型 人工智能
相关文章