PaperWeekly 前天 17:22
ICML 2025 | Agentic时代唤醒NAS"第二春"!智能体超网动态组队,推理成本暴降55%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

MaAS(Multi-agent Architecture Search)框架由新加坡国立大学等研究团队推出,旨在解决大语言模型驱动的多智能体系统构建难题。该框架借鉴NAS技术,构建“智能体超网”,根据不同任务动态匹配最合适的智能体架构,实现“按需定制”服务。实验表明,MaAS在性能和成本上均有显著优势,推理成本降低,训练效率提升,为构建高效、经济、可规模化的AI应用开辟了新道路。

💡MaAS的核心在于智能体超网。它将智能体架构设计问题转化为优化一个概率性、连续的架构分布,就像一个包含各种能力“积木”的乐高池,可以根据任务需求动态采样。

🤖MaAS通过控制器分析查询,从超网中动态采样最适合的智能体架构。对于简单任务,MaAS会选择浅层架构,快速给出答案;对于复杂任务,则构建深度、并行的智能体网络,实现智能资源的最佳配置。

💰MaAS引入成本约束,通过蒙特卡洛采样和文本梯度技术,优化性能与成本。实验显示,MaAS在推理成本上仅为其他方法的45%,训练成本也显著降低,例如在MATH基准上,训练成本仅为3.38美元,而性能相近的方法则需要22.50美元。

📊在多项基准测试中,MaAS展现出卓越的性能。在GSM8K、MATH等六大主流基准测试中,MaAS的平均得分高达83.59%,相较于现有SOTA方法,实现了0.54%~11.82%的性能提升。

原创 让你更懂AI的 2025-06-12 12:34 北京

用超网为每个任务“量体裁衣”

在 AI 的浪潮之巅,大语言模型(LLM)驱动的多智能体系统,正以其强大的协同能力,不断刷新我们对智能的想象。但一个痛点始终存在:构建这些复杂的系统,往往依赖于“炼丹师”们大量的手动设计和调试,这就像在用手工作坊的方式打造星际飞船,效率低下且难以规模化。


今天,这一瓶颈被彻底打破!来自新加坡国立大学、中国科学技术大学、同济大学和上海人工智能实验室的研究团队,联手推出 MaAS(Multi-agent Architecture Search),一个革命性的自动化框架。


它为古老的 NAS(神经架构搜索)技术注入了智能体时代的灵魂,实现了真正的“按需定制”智能体服务——为不同的任务,动态匹配最合适的智能体架构!论文目前已经被 ICML 2025 录用为 Oral Presentation

论文标题:

Multi-agent Architecture Search via Agentic Supernet

论文地址:

https://arxiv.org/abs/2502.04180

Github链接:

https://github.com/bingreeky/MaAS



困境:“一刀切”的智能体,是才华的浪费

当前的智能体系统设计,普遍陷入一个“一刀切”的窘境:无论是自动化搜索还是手动搭建,目标都是构建一个“大而全”的静态系统,妄图用一套固定的“万金油”流程解决所有问题。这会带来什么问题?


我们坚信,未来的智能体系统应当是弹性的、动态的。为此,MaAS 提出了一个全新的范式——智能体超网(Agentic Supernet)。

▲ 图1: 多智能体超网示意图:为不同复杂度的任务,动态采样出最合适的智能体架构。



核心方法:智能体超网,NAS“老树开新花”

MaAS 的核心思想,是将智能体架构的设计问题,从寻找一个“最优单点解”,转变为优化一个概率性的、连续的架构分布——即“智能体超网”。


这个超网,就像一个巨大的智能体“乐高池”,包含了诸如链式思考(CoT)、多智能体辩论(Debate)、ReAct 等各式各样的能力“积木”(Agentic Operators)。MaAS 能从中为每个任务“量体裁衣”。

▲ 图2: MaAS 方法示意图:控制器根据查询,从超网中采样,经环境反馈,通过文本梯度进行优化。](supernet.png)

2.1  按需采样:你的问题,决定了你的智能体系统

当一个查询(Query)到来,MaAS 的控制器(Controller)会立刻对其进行分析,然后像一位智慧的指挥家,从超网中动态采样出一个最适合当前任务的多智能体架构。


具体来说,MaAS 的采样过程可以用以下公式表示:

其中, 表示在第  层选择的操作符, 是查询, 是超网络的参数化分布, 是所有可用的操作符集合。通过这种方式,MaAS 能够根据查询的复杂度动态调整采样深度,实现资源的高效利用。

2.2 成本优化:不仅要效果好,更要花钱少

MaAS 的聪明之处不止于此。在优化过程中,它引入了成本约束。通过蒙特卡洛采样和文本梯度(Textual Gradient)技术,MaAS 能够同时优化“性能”与“成本”(如 Token 消耗、API 调用费),在保证高质量输出的同时,把每一分钱都花在刀刃上。优化目标可以表示为:

其中,(C(G; q))是智能体系统(G)对于查询(q)的成本,(lambda)是权衡参数。通过这种方式,MaAS 能够在性能和成本之间取得最佳平衡。



实验验证:性能与成本的“双重胜利”

在实验部分,MaAS 在 GSM8K、MATH、HumanEval、GAIA 等六大主流基准测试中,与 14 个现有顶尖的单智能体、多智能体方法进行了比较。

性能上,MaAS 的平均得分高达 83.59%,相较于现有 SOTA 方法,实现了 0.54%~11.82% 的性能提升,展现了惊人的通用性和有效性。


成本上,更是降维打击!

▲ 图5:成本对比表,MaAS 在训练成本、推理成本和时间上均有巨大优势。



▲ 图6:成本分析图



案例展示:杀鸡焉用牛刀,智能体“按需分配”

MaAS 是如何做到“千人千面”的?下图生动地展示了它面对不同难度任务时的“思考路径”。

▲ 图7:案例展示:面对简单问题(上),MaAS浅尝辄止;面对复杂问题(下),则构建深度、并行的智能体网络


可以看到,MaAS 完美地实现了任务难度的动态感知。它“杀鸡绝不用牛刀”,对于简单的任务,在极浅的层数就提前退出;而对于复杂的任务,则毫不犹豫地深入 3-4 层网络,并在每一层激活多个智能体算子并行处理,真正实现了智能资源的最佳配置。



展望:开启智能体架构搜索新纪元

MaAS 的提出,不仅是 NAS 技术在 Agentic 时代的华丽回归,更重要的是,它改变了游戏规则。它将多智能体系统的设计范式从“静态、僵化”推向了“动态、自适应”的新范式。


我们相信,MaAS 为构建下一代高效、经济、可规模化的 AI 应用铺平了道路。未来,无论是教育、科研还是工业界,都可以利用这一框架,为特定场景快速定制出高性价比的智能解决方案。


更多阅读



#投 稿 通 道#

 让你的文字被更多人看到 



如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。


总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 


PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。


📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算


📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿


△长按添加PaperWeekly小编



🔍


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧


·


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MaAS 智能体 NAS AI
相关文章