PaperAgent 前天 19:38
支持5000+ Server,ScaleMCP为大模型Agents动态同步MCP工具
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

ScaleMCP旨在提升LLM Agents与外部工具和API的交互能力。它通过动态地为LLM代理配备MCP工具检索器,赋予代理自主添加工具到记忆中的能力。ScaleMCP还通过与MCP服务器进行CRUD操作,实现自动同步的工具存储系统。此外,提出的TDWA嵌入策略能够选择性地强调工具文档的关键部分。实验结果表明,ScaleMCP在工具选择和调用方面显著提升了LLM代理的性能,特别是在复杂多跳查询中,为代理提供了更好的工具管理能力。TDWA策略在与LLM重排序器结合时,能够更好地捕捉工具文档的语义信息。

🛠️ScaleMCP是一种新颖的工具选择方法,它动态地为LLM代理配备了一个MCP工具检索器,使代理能够自主地将工具添加到其记忆中,从而提升了LLM Agents与外部工具和API的交互能力。

🗂️ScaleMCP实现了一个自动同步的工具存储系统管道,通过与MCP服务器(作为唯一真实来源)进行CRUD操作,解决了现有工具选择框架依赖手动更新导致的重复、不一致和低效问题。

📊提出的工具文档加权平均(TDWA)嵌入策略,旨在在嵌入过程中选择性地强调工具文档的关键部分(例如工具名称或合成问题),实验表明TDWA在语义相关性方面具有优势。

🔍实验结果表明,ScaleMCP通过自动同步工具存储系统和TDWA嵌入策略,显著提升了LLM代理在工具选择和调用方面的性能,尤其是在复杂多跳查询中。

🧠在LLM代理评估中,gpt-o3在使用向量搜索和Cohere重排序器时,Task Completion Score达到94.4%,但Tool Correctness仅为36.1%;gpt-4o-mini在相同配置下平衡了Tool Correctness(54.0%)和Task Completion Score(86.7%)。

2025-05-19 23:27 广东

模型上下文协议(MCP)极大地提升了LLM Agents与外部工具和API动态交互的能力。现有的工具选择框架并未整合MCP服务器,而是严重依赖容易出错的手动更新,来维护本地的单体工具库,这导致了重复、不一致和低效的问题。此外,当前的方法在调用LLM代理之前就对工具选择进行了抽象化,限制了代理的自主性,并阻碍了在多轮交互过程中动态重新查询的能力。

为了解决这些问题,普华永道提出了ScaleMCP,这是一种新颖的工具选择方法,动态地为LLM代理配备了一个MCP工具检索器,赋予代理自主地将工具添加到其记忆中的能力,同时还通过与MCP服务器(作为唯一真实来源)进行CRUD(创建、读取、更新、删除)操作,实现了一个自动同步的工具存储系统管道。

还提出了一种新的嵌入策略——工具文档加权平均(TDWA),旨在在嵌入过程中选择性地强调工具文档的关键部分(例如工具名称或合成问题)。

数据集构建

实验1:MCP向量数据库检索

实验2:LLM代理评估

实验3:TDWA权重评估

更多信息:《动手设计AI Agents:CrewAI版》、《高级RAG之36技》、新技术实战:中文Lazy-GraphRAG/Manus+MCP/GRPO+Agent、大模型日报/月报、最新技术热点追踪解读(GPT4-o/数字人/MCP/Gemini 2.5 Pro)

    https://arxiv.org/pdf/2505.06416

    SCALEMCP: DYNAMIC AND AUTO-SYNCHRONIZING MODEL CONTEXT PROTOCOL TOOLS FOR LLM AGENTS

    推荐阅读


      欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

      阅读原文

      跳转微信打开

      Fish AI Reader

      Fish AI Reader

      AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

      FishAI

      FishAI

      鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

      联系邮箱 441953276@qq.com

      相关标签

      LLM Agents ScaleMCP 工具选择 TDWA MCP
      相关文章