index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html
![]()
本文探讨了大型语言模型(LLM)在复杂决策,特别是与其他智能体互动时面临的挑战。即使是最先进的LLM在处理博弈时也难以计算纳什均衡,且在不确定性和噪声下缺乏鲁棒性。分享嘉宾提出了基于博弈论的工作流,以理性和帕累托最优性为评估指标,旨在提升智能体在交互中的表现。本次分享将讨论如何设计工作流来指导智能体应对不同场景,并探讨LLM在资源分配博弈中的应用。此外,文章还介绍了「大语言模型与多智能体系统」读书会,邀请多位学者分享研究成果,并鼓励大家加入共同学习。
💡 核心挑战:大型语言模型(LLM)在处理涉及与其他智能体互动的复杂决策时,面临着计算纳什均衡和鲁棒性问题,特别是在不确定性和噪声环境下。
🎯 博弈论工作流:研究者提出基于博弈论的工作流,以理性和帕累托最优性为评估指标,旨在提升智能体在以自我利益最大化为指导的交互中的表现。这是一种通过理论指导实践的方式,来优化智能体的决策能力。
📚 读书会分享:罗格斯大学的华文越博士分享了其在博弈论在智能体应用中的最新研究成果,并介绍了大语言模型与多智能体系统读书会。该读书会汇集了多位学者,共同探讨大模型与智能体相关话题,促进学术交流和合作。
🤖 应用场景:读书会的内容涵盖了大语言模型赋能下智能体之间的辩论、协作、模拟人类,以及实际场景中的多机器人协作等问题,显示了LLM在多智能体系统中的广泛应用前景。
大语言模型遭遇囚徒困境时,会如何决策?目前人工智能在面对复杂决策,特别是涉及到与其他智能体的互动时,依然存在很大的局限性。即使是最先进的大型语言模型(LLM)在处理这些博弈时也面临着计算纳什均衡的挑战,在面对不确定性和噪声时仍存在鲁棒性问题。如何创建一个理性的基于LLM的智能体?能否通过创新的算法工作流来提高智能体的谈判能力和资源分配效率?针对这些问题,分享嘉宾提出了基于博弈论的工作流:将博弈论作为基础,以理性和帕累托最优性作为两大基本评估指标——即个体是否理性,以及是否基于个体理性得出全局最优解——旨在观察并提升智能体在以自我利益最大化为指导的交互中的表现。本周日上午10点,大语言模型与多智能体系统带来社区福利:来自罗格斯大学的华文越将分享她的最新研究成果,谈谈博弈论在智能体中的应用。欢迎加入一起探索如何设计工作流,来指导智能体面对不同的场景。完全信息博弈
不完全信息博弈
LLM与资源分配博弈实验
基于资源分配博弈的工作流设计
意外发现
未来方向
华文越,罗格斯大学新布朗斯维克分校在读博士,导师为张永锋老师,研究方向为LLM,LLM-based Agent等。发表论文在ICLR, NeurIPS, ACL, EMNLP, TACL, EACL等期刊。ARR/EMNLP/SIGIR/WWW/WSDM/RecSys/TORS审核中。个人主页:https://wenyueh.github.io/。
赵世钰
任沁源
崔金强
[1] Hua W, Liu O, Li L, et al. Game-theoretic LLM: Agent Workflow for Negotiation Games[J].本次分享将于2024年 12 月 22 日(本周日)上午10:00-11:00在腾讯会议进行,感兴趣的朋友可以扫码参与本次分享,并加入读书会社群。

扫码参与大模型与多智能体系统读书会,加入群聊,获取系列读书会回看权限,成为种子用户,与社区的一线科研工作者与企业实践者沟通交流,共同推动多智能体这一前沿领域的发展。读书会成员均可以在读书会期间申请成为主讲人。主讲人作为读书会成员,均遵循内容共创共享机制,可以获得报名费退款,并共享本读书会产生的所有内容资源。具体见系列读书会详情:
大语言模型与多智能体系统读书会:大模型赋能机器人涌现群体智能
集智俱乐部携手西湖大学工学院特聘研究员赵世钰、浙江大学教授任沁源、鹏城实验室高级工程师崔金强,共同发起了「大语言模型与多智能体系统」读书会。
在本次读书会中,我们将讨论大模型与智能体的相关话题,内容涵盖大语言模型赋能下智能体之间的辩论、协作、模拟人类,以及实际场景中的多机器人协作等问题。我们已邀请到多名科研前沿学者进行分享,包括圣母大学的郭泰成博士、中科院自动化的马纬彧硕士、清华大学的钱忱博士后研究员、伊利诺伊大学厄巴纳香槟分校的王镇海龙博士、清华大学的徐玉庄硕士、清华大学的杨宗瀚博士、清华大学的刘子君、马萨诸塞大学阿默斯特分校的张洪鑫博士、浙江大学的张锦添硕士、NVIDIA NeMo NLP团队的高级应用科学家王智琳、北京大学的董益宏博士 、麻省理工学院的郑志凌博士后、清华大学的梁添硕士、麻省理工大学的Yilun Du博士、新泽西州立罗格斯大学新布朗斯维克的华文越博士、弗吉尼亚理工大学的Navid Ghaffarzade教授,如果您对大模型与多智能体系统感兴趣,欢迎加入我们,可以来做分享,也可以来交朋友,最重要的是一起来学习!
此次活动特别鸣谢Datawhale、Agents42。Datawhale
一个专注于AI领域的开源组织,汇聚了众多优秀学习者,使命for the learner,和学习者一起成长。Agents42
一个致力于推进AI Agents产学研融合及创新的生态开放平台。
内容中包含的图片若涉及版权问题,请及时与我们联系删除