PaperAgent 04月24日 21:54
380篇文献!首份Agentic大模型最新技术综述
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文深入探讨了Agentic LLMs,即能够作为智能Agent行动的大语言模型,它们具备推理、行动和交互能力。文章综述了相关技术,并提出了未来研究议程。Agentic LLMs主要分为三个类别:推理、行动和交互。推理使模型能够进行逻辑思考和问题解决;行动使模型能够执行具体任务,如通过工具和机器人进行操作;交互使模型能够与其他智能体进行有效协作。文章详细讨论了这三个方面的研究进展和技术方法,为未来的研究方向提供了指导。

🧠推理能力:Agentic LLMs通过多步推理(如链式思考、自我一致性、搜索树)、自我反思(提示改进、LLMs自我反思)和检索增强(自适应检索、检索增强生成)等方法,显著提升了逻辑思考、问题解决和决策制定能力。

🤖行动能力:Agentic LLMs通过行动模型(世界模型、多模态视觉-语言-行动模型)、机器人和工具(机器人规划、行动工具、计算机和浏览器工具)以及助手(对话助手、医疗助手、交易助手、科学助手)等方式,执行具体任务并提高实用性。

🤝交互能力:Agentic LLMs在社会能力(对话、战略行为、心理理论)、基于角色的交互(多LLM环境中的战略行为、基于角色的任务解决和团队合作)以及模拟开放社会(社会规范的形成、开放世界代理)等方面展现出强大的交互能力,能够与其他智能体有效协作。

2025-04-24 17:00 湖北

什么是Agentic LLMs?以及具备哪些能力?

Agentic LLMs是指那些能够作为智能Agent行动的大语言模型,它们具备推理、行动和交互的能力,基于此对相关技术进行综述,并提出了一个研究议程,指导未来研究方向。
Agentic大语言模型(LLM)分类体系的三个类别——推理、行动和交互(以红色表示)之间的良性循环。影响某一类别的概念以绿色表示。图中还标示了反馈循环,即推理、行动和交互产生新的数据,用于预训练和微调LLMs。
一、推理(Reasoning)
详细讨论了代理型大语言模型(Agentic LLMs)在推理能力方面的研究进展和技术方法。推理能力是代理型LLMs的核心组成部分之一,它使模型能够进行逻辑思考、问题解决和决策制定:

1. 多步推理方法

多步推理方法是提升LLMs推理能力的重要技术。这些方法通过将复杂问题分解为多个中间步骤来逐步解决问题,从而提高模型的准确性和可靠性。主要方法包括:

2. 自我反思

自我反思是推理能力的另一个重要方面,它允许模型评估和改进自己的结果。主要方法包括:

3. 检索增强

检索增强方法通过在推理时检索额外的信息来解决LLMs缺乏及时信息的问题。这些方法包括:

二、行动(Acting)
详细探讨了代理型大语言模型(Agentic LLMs)在执行具体行动方面的能力和研究进展。这一节的核心内容集中在如何使LLMs能够通过工具、机器人和多模态交互来实现具体的行动任务:

1. 行动模型

行动模型是使LLMs能够理解和执行具体任务的基础。讨论了如何通过世界模型(World Models)和多模态视觉-语言-行动模型(Vision-Language-Action Models, VLA)来增强LLMs的行动能力。

2. 机器人和工具

讨论了如何使LLMs能够通过机器人和工具来执行具体任务,从而提高其实用性。

3. 助手

讨论了如何将LLMs应用于各种助手场景,从而提高其在实际应用中的价值。

    三、交互(Interacting)

    详细探讨了代理型大语言模型(Agentic LLMs)在交互能力方面的研究进展和技术方法:如何使LLMs能够与其他智能体(包括人类和其他LLMs)进行有效交互,从而实现更复杂的社会行为和协作任务。

    1. LLMs的社会能力

    讨论了传统LLMs在社会和交互能力方面的基础,包括对话、战略行为和心理理论(Theory of Mind)。

    2. 基于角色的交互

    讨论了LLMs在多智能体环境中通过角色扮演进行交互的能力,包括战略行为、团队合作和任务解决。

    3. 模拟开放社会

    讨论了LLMs在开放社会中的交互能力,包括社会规范的形成、社会动态和集体行为。

      Agentic Large Language Models, a surveyhttps://askeplaat.github.io/agentic-llm-survey-site/https://arxiv.org/pdf/2503.23037

      推荐阅读


        欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

        阅读原文

        跳转微信打开

        Fish AI Reader

        Fish AI Reader

        AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

        FishAI

        FishAI

        鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

        联系邮箱 441953276@qq.com

        相关标签

        Agentic LLMs 大语言模型 智能Agent
        相关文章