原创 让你更懂AI的 2025-06-12 12:34 北京
用超网为每个任务“量体裁衣”
在 AI 的浪潮之巅,大语言模型(LLM)驱动的多智能体系统,正以其强大的协同能力,不断刷新我们对智能的想象。但一个痛点始终存在:构建这些复杂的系统,往往依赖于“炼丹师”们大量的手动设计和调试,这就像在用手工作坊的方式打造星际飞船,效率低下且难以规模化。
今天,这一瓶颈被彻底打破!来自新加坡国立大学、中国科学技术大学、同济大学和上海人工智能实验室的研究团队,联手推出 MaAS(Multi-agent Architecture Search),一个革命性的自动化框架。
它为古老的 NAS(神经架构搜索)技术注入了智能体时代的灵魂,实现了真正的“按需定制”智能体服务——为不同的任务,动态匹配最合适的智能体架构!论文目前已经被 ICML 2025 录用为 Oral Presentation。
论文标题:
Multi-agent Architecture Search via Agentic Supernet
论文地址:
https://arxiv.org/abs/2502.04180
Github链接:
https://github.com/bingreeky/MaAS
当前的智能体系统设计,普遍陷入一个“一刀切”的窘境:无论是自动化搜索还是手动搭建,目标都是构建一个“大而全”的静态系统,妄图用一套固定的“万金油”流程解决所有问题。这会带来什么问题?
简单任务,高射炮打蚊子:当用户只是问 “1+2*3-2=?”,系统却启动了一套包含多轮反思、辩论的复杂流程,造成巨大的资源浪费。
复杂任务,捉襟见肘:当面对“设计一个电商网站后台”这样的艰巨挑战,固定的简单流程又显得力不从心,无法有效完成任务。
我们坚信,未来的智能体系统应当是弹性的、动态的。为此,MaAS 提出了一个全新的范式——智能体超网(Agentic Supernet)。
核心方法:智能体超网,NAS“老树开新花”
MaAS 的核心思想,是将智能体架构的设计问题,从寻找一个“最优单点解”,转变为优化一个概率性的、连续的架构分布——即“智能体超网”。
这个超网,就像一个巨大的智能体“乐高池”,包含了诸如链式思考(CoT)、多智能体辩论(Debate)、ReAct 等各式各样的能力“积木”(Agentic Operators)。MaAS 能从中为每个任务“量体裁衣”。
当一个查询(Query)到来,MaAS 的控制器(Controller)会立刻对其进行分析,然后像一位智慧的指挥家,从超网中动态采样出一个最适合当前任务的多智能体架构。
简单算术题?也许一层简单的 I/O 后,系统就选择了 Early-Exit ,秒速给出答案,干净利落。
复杂代码挑战?控制器可能会组建一个包含 ReAct (工具调用)、 Self-Refine (自我修正)和 Debate (多方辩论)的多层深度网络,通过“群策群力”攻克难关。
具体来说,MaAS 的采样过程可以用以下公式表示:
其中, 表示在第 层选择的操作符, 是查询, 是超网络的参数化分布, 是所有可用的操作符集合。通过这种方式,MaAS 能够根据查询的复杂度动态调整采样深度,实现资源的高效利用。
2.2 成本优化:不仅要效果好,更要花钱少
MaAS 的聪明之处不止于此。在优化过程中,它引入了成本约束。通过蒙特卡洛采样和文本梯度(Textual Gradient)技术,MaAS 能够同时优化“性能”与“成本”(如 Token 消耗、API 调用费),在保证高质量输出的同时,把每一分钱都花在刀刃上。优化目标可以表示为:
其中,(C(G; q))是智能体系统(G)对于查询(q)的成本,(lambda)是权衡参数。通过这种方式,MaAS 能够在性能和成本之间取得最佳平衡。
实验验证:性能与成本的“双重胜利”
在实验部分,MaAS 在 GSM8K、MATH、HumanEval、GAIA 等六大主流基准测试中,与 14 个现有顶尖的单智能体、多智能体方法进行了比较。
性能上,MaAS 的平均得分高达 83.59%,相较于现有 SOTA 方法,实现了 0.54%~11.82% 的性能提升,展现了惊人的通用性和有效性。
成本上,更是降维打击!
推理成本暴降:MaAS 完成任务所需的平均推理成本(Token 消耗等)仅为其他自动化或手动系统的 45%!
训练成本悬殊:在 MATH 基准上,MaAS 的训练成本仅为 3.38 美元,而性能相近的 AFlow 则需 22.50 美元,成本相差近 7 倍!
优化效率飞跃:MaAS 的优化过程仅需 53 分钟,而其他方法动辄数小时。
案例展示:杀鸡焉用牛刀,智能体“按需分配”
MaAS 是如何做到“千人千面”的?下图生动地展示了它面对不同难度任务时的“思考路径”。
可以看到,MaAS 完美地实现了任务难度的动态感知。它“杀鸡绝不用牛刀”,对于简单的任务,在极浅的层数就提前退出;而对于复杂的任务,则毫不犹豫地深入 3-4 层网络,并在每一层激活多个智能体算子并行处理,真正实现了智能资源的最佳配置。
展望:开启智能体架构搜索新纪元
MaAS 的提出,不仅是 NAS 技术在 Agentic 时代的华丽回归,更重要的是,它改变了游戏规则。它将多智能体系统的设计范式从“静态、僵化”推向了“动态、自适应”的新范式。
我们相信,MaAS 为构建下一代高效、经济、可规模化的 AI 应用铺平了道路。未来,无论是教育、科研还是工业界,都可以利用这一框架,为特定场景快速定制出高性价比的智能解决方案。
更多阅读
#投 稿 通 道#
让你的文字被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。
📝 稿件基本要求:
• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注
• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题
• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算
📬 投稿通道:
• 投稿邮箱:hr@paperweekly.site
• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者
• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿
△长按添加PaperWeekly小编
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
·