PaperAgent 2024年12月22日
清华、面壁智能发布:主动式Agent 2.0
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了主动式Agent的概念及其在解决复杂任务中的卓越能力。与被动式Agent不同,主动式Agent能够主动发起任务,无需明确的人类指令,从而减轻用户认知负担并识别潜在需求。文章详细阐述了主动式Agent的工作流程,包括数据收集、场景生成、事件生成以及代理预测与任务执行。通过Activity Watcher监控用户交互,利用GPT-4o生成任务和实体,再通过环境健身房模拟用户活动并生成详细事件。最后,使用奖励模型评估预测任务的性能,证明了主动式Agent在理解用户需求和执行任务方面的优势。

⚙️ 主动式Agent的核心在于其能够主动预测并发起任务,而非被动响应用户指令,这标志着Agent技术从被动响应向主动服务的重大转变。

📝 主动式Agent的数据收集与处理流程包括:使用Activity Watcher监控用户交互,将原始数据合并为连贯文本,并使用语言模型进行自然语言描述。

💡 场景生成过程利用GPT-4o创建任务和实体,并通过添加细节完善场景,生成模拟用户活动和环境交互的详细事件。

🎯 在代理预测与任务执行阶段,主动代理接收新事件后,更新记忆并提出可能的任务,并在用户接受后执行,最终通过奖励模型进行评估。

CourseAI 2024-12-22 11:00 湖北

本公众号主要关注NLP、CV、LLM、RAG、Agent等AI前沿技术,免费分享业界实战案例与课程,助力您全面拥抱AIGC。



Agent展现出了解决复杂任务的卓越能力。

ProactiveAgent流程图

数据收集与处理

    环境监控与事件收集:开发基于Activity Watcher的监控软件,捕获用户与计算机系统的交互细节,包括键盘和鼠标操作、访问的网页和使用的开发工具。

    事件合并与文本描述:将原始数据合并成逻辑上连贯的段落,并使用语言模型将结构化数据转换为更自然的文本描述。

场景生成

    种子工作生成:使用GPT-4o基于人类标注者收集的种子工作创建各种任务,这些任务可能是用户在特定类别下执行的,如编码、写作或日常生活。

    实体生成:为任务可能涉及的实体(如浏览器、软件和工具)生成所有可能的实体。

    场景细化:通过添加更多细节(如实体状态或日期时间)来完善场景,并根据收集的事件为每个特定上下文生成示例事件。

事件生成

    用户活动生成:对于每个场景,用户代理首先描述其在模拟环境中完成工作的活动和行动。

    事件详细生成:环境健身房接受用户活动和行动,逐一生成详细事件。

    状态维护:环境健身房在生成新事件时更新实体的状态和属性,并根据最新环境状态生成下一个事件。

代理预测与任务执行

    预测任务:主动代理接收新事件后,更新其记忆,并结合新旧事件及与用户的对话历史,提出可能的任务。

    执行任务:一旦用户接受预测任务,代理将在环境健身房中执行任务,产生关于代理与环境交互的多个事件。

奖励模型评估

    模型训练:使用人类标注的数据训练LLaMA-3.1-8B-Instruct模型,并与几个基线模型进行比较,以展示其优越性。

    评估指标:使用奖励模型对预测任务进行二元分类,并与人类标注结果进行比较,计算召回率、精确度、准确度和F1-Score。

https://github.com/thunlp/ProactiveAgenthttps://arxiv.org/abs/2410.12361


跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

主动式Agent AI 任务预测 环境交互 奖励模型
相关文章