ICML 2025 | Agentic时代唤醒NAS"第二春"！智能体超网动态组队，推理成本暴降55%

原创让你更懂AI的 2025-06-12 12:34 北京

用超网为每个任务“量体裁衣”

在 AI 的浪潮之巅，大语言模型（LLM）驱动的多智能体系统，正以其强大的协同能力，不断刷新我们对智能的想象。但一个痛点始终存在：构建这些复杂的系统，往往依赖于“炼丹师”们大量的手动设计和调试，这就像在用手工作坊的方式打造星际飞船，效率低下且难以规模化。

今天，这一瓶颈被彻底打破！来自新加坡国立大学、中国科学技术大学、同济大学和上海人工智能实验室的研究团队，联手推出 MaAS（Multi-agent Architecture Search），一个革命性的自动化框架。

它为古老的 NAS（神经架构搜索）技术注入了智能体时代的灵魂，实现了真正的“按需定制”智能体服务——为不同的任务，动态匹配最合适的智能体架构！论文目前已经被 ICML 2025 录用为 Oral Presentation。

论文标题：

Multi-agent Architecture Search via Agentic Supernet

论文地址：

https://arxiv.org/abs/2502.04180

Github链接：

https://github.com/bingreeky/MaAS

困境：“一刀切”的智能体，是才华的浪费

当前的智能体系统设计，普遍陷入一个“一刀切”的窘境：无论是自动化搜索还是手动搭建，目标都是构建一个“大而全”的静态系统，妄图用一套固定的“万金油”流程解决所有问题。这会带来什么问题？

简单任务，高射炮打蚊子：当用户只是问 “1+2*3-2=?”，系统却启动了一套包含多轮反思、辩论的复杂流程，造成巨大的资源浪费。

复杂任务，捉襟见肘：当面对“设计一个电商网站后台”这样的艰巨挑战，固定的简单流程又显得力不从心，无法有效完成任务。

我们坚信，未来的智能体系统应当是弹性的、动态的。为此，MaAS 提出了一个全新的范式——智能体超网（Agentic Supernet）。

▲ 图1: 多智能体超网示意图：为不同复杂度的任务，动态采样出最合适的智能体架构。

核心方法：智能体超网，NAS“老树开新花”

MaAS 的核心思想，是将智能体架构的设计问题，从寻找一个“最优单点解”，转变为优化一个概率性的、连续的架构分布——即“智能体超网”。

这个超网，就像一个巨大的智能体“乐高池”，包含了诸如链式思考（CoT）、多智能体辩论（Debate）、ReAct 等各式各样的能力“积木”（Agentic Operators）。MaAS 能从中为每个任务“量体裁衣”。

▲ 图2: MaAS 方法示意图：控制器根据查询，从超网中采样，经环境反馈，通过文本梯度进行优化。](supernet.png)

2.1 按需采样：你的问题，决定了你的智能体系统

当一个查询（Query）到来，MaAS 的控制器（Controller）会立刻对其进行分析，然后像一位智慧的指挥家，从超网中动态采样出一个最适合当前任务的多智能体架构。

简单算术题？也许一层简单的 I/O 后，系统就选择了 Early-Exit ，秒速给出答案，干净利落。

复杂代码挑战？控制器可能会组建一个包含 ReAct （工具调用）、 Self-Refine （自我修正）和 Debate （多方辩论）的多层深度网络，通过“群策群力”攻克难关。

具体来说，MaAS 的采样过程可以用以下公式表示：

其中，表示在第层选择的操作符，是查询，是超网络的参数化分布，是所有可用的操作符集合。通过这种方式，MaAS 能够根据查询的复杂度动态调整采样深度，实现资源的高效利用。

2.2 成本优化：不仅要效果好，更要花钱少

MaAS 的聪明之处不止于此。在优化过程中，它引入了成本约束。通过蒙特卡洛采样和文本梯度（Textual Gradient）技术，MaAS 能够同时优化“性能”与“成本”（如 Token 消耗、API 调用费），在保证高质量输出的同时，把每一分钱都花在刀刃上。优化目标可以表示为：

其中，（C（G; q））是智能体系统（G）对于查询（q）的成本，（lambda）是权衡参数。通过这种方式，MaAS 能够在性能和成本之间取得最佳平衡。

实验验证：性能与成本的“双重胜利”

在实验部分，MaAS 在 GSM8K、MATH、HumanEval、GAIA 等六大主流基准测试中，与 14 个现有顶尖的单智能体、多智能体方法进行了比较。

性能上，MaAS 的平均得分高达 83.59%，相较于现有 SOTA 方法，实现了 0.54%~11.82% 的性能提升，展现了惊人的通用性和有效性。

成本上，更是降维打击！

▲ 图5：成本对比表，MaAS 在训练成本、推理成本和时间上均有巨大优势。

推理成本暴降：MaAS 完成任务所需的平均推理成本（Token 消耗等）仅为其他自动化或手动系统的 45%！

训练成本悬殊：在 MATH 基准上，MaAS 的训练成本仅为 3.38 美元，而性能相近的 AFlow 则需 22.50 美元，成本相差近 7 倍！

优化效率飞跃：MaAS 的优化过程仅需 53 分钟，而其他方法动辄数小时。

▲ 图6：成本分析图

案例展示：杀鸡焉用牛刀，智能体“按需分配”

MaAS 是如何做到“千人千面”的？下图生动地展示了它面对不同难度任务时的“思考路径”。

▲ 图7：案例展示：面对简单问题（上），MaAS浅尝辄止；面对复杂问题（下），则构建深度、并行的智能体网络

可以看到，MaAS 完美地实现了任务难度的动态感知。它“杀鸡绝不用牛刀”，对于简单的任务，在极浅的层数就提前退出；而对于复杂的任务，则毫不犹豫地深入 3-4 层网络，并在每一层激活多个智能体算子并行处理，真正实现了智能资源的最佳配置。

展望：开启智能体架构搜索新纪元

MaAS 的提出，不仅是 NAS 技术在 Agentic 时代的华丽回归，更重要的是，它改变了游戏规则。它将多智能体系统的设计范式从“静态、僵化”推向了“动态、自适应”的新范式。

我们相信，MaAS 为构建下一代高效、经济、可规模化的 AI 应用铺平了道路。未来，无论是教育、科研还是工业界，都可以利用这一框架，为特定场景快速定制出高性价比的智能解决方案。

更多阅读

#投稿通道#

让你的文字被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个，让知识真正流动起来。

📝 稿件基本要求：

• 文章确系个人原创作品，未曾在公开渠道发表，如为其他平台已发表或待发表的文章，请明确标注

• 稿件建议以 markdown 格式撰写，文中配图以附件形式发送，要求图片清晰，无版权问题

• PaperWeekly 尊重原作者署名权，并将为每篇被采纳的原创首发稿件，提供业内具有竞争力稿酬，具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道：

• 投稿邮箱：hr@paperweekly.site

• 来稿请备注即时联系方式（微信），以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信（pwbot02）快速投稿，备注：姓名-投稿

△长按添加PaperWeekly小编

🔍

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

阅读原文

跳转微信打开

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签