机器之心 前天 17:17
统一20+多智能体方法,MASLab震撼发布
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

MASLab 是一个由上海交通大学等机构联合推出的开源代码库,旨在推动多智能体系统(MAS)领域的发展。它统一集成了超过 20 种主流 MAS 方法,涵盖了过去两年内各大顶会的成果,并提供了统一的评估协议和清晰的结构,方便研究者进行复现和拓展。MASLab 进行了大量实验分析,展示了不同 MAS 方法在多个任务维度下的性能,并提出了更高效的 MAS 方法 MASLab-ReAct。此外,MASLab 还探讨了评估协议对 MAS 方法排名的影响,并分析了不同模型尺寸对 MAS 表现的影响,致力于构建可持续发展的 MAS 研究社区。

💡 **方法集成**:MASLab 统一集成了超过 20 种主流多智能体方法,包括 AgentVerse、ChatDev 等,涵盖了过去两年内各大顶会的成果,为研究者提供了便利。

✅ **评估统一**:MASLab 提供了统一的输入预处理、LLM 配置和评估协议,确保横向评测的公平性和可重复性,方便研究者进行对比分析。

📊 **性能分析**:研究者利用 MASLab 进行了大量实验分析,覆盖 10 余种评测基准,并首次系统地刻画了大模型多智能体方法在多个任务维度下的性能图谱。

🛠️ **高效方法**:MASLab 研究团队基于现有成果,创新性地提出了更高效的 MAS 方法——MASLab-ReAct,该方法支持多种工具,并在 GAIA 验证集上取得了更优结果。

🌐 **开源社区**:MASLab 致力于构建开源平台,欢迎社区贡献,共同打造 MAS 的标准实验平台,并计划持续开源更多方法与基准,推动 MAS 研究社区的发展。


OpenAI 在通向 AGI(通用人工智能)的五大阶段中,将组织级智能列为最终目标:即 AI 能像一个组织般管理复杂流程、决策高层任务、协调大规模操作。 近两年来,大量多智能体系统(Multi-Agent Systems, MAS)研究陆续涌出,不断朝这这一里程碑迈进。


为了推动该领域加速健康发展,由上海交通大学、上海 AI 实验室、牛津大学、普林斯顿大学、Meta 等十个机构联合推出的 MASLab,带来首个统一、全面、研究友好的大模型多智能体系统代码库:



论文地址:https://arxiv.org/pdf/2505.16988

代码地址:https://github.com/MASWorks/MASLab


「一键横评」「快速上手」「复现无忧」


你是否也曾:


看了几十篇 MAS 论文,却发现代码实现千差万别?

打开一个 MAS 项目的仓库,一眼望去配置乱、接口杂?

想尝试复现或二次开发,但总是无从下手,Debug 到天亮?


那你一定不能错过 MASLab!


🧠 MASLab 有多好用?


MASLab 统一化集成了超过 20 种主流 MAS 方法,涵盖过去两年内各大顶会的成果、多个领域、多种任务类型。并且每种方法都经过研究者们逐步输出比对,确保过程和结果严格遵循原始实现!



三大核心特性,一次到位:


✅ 方法全:包含 AgentVerse、ChatDev、LLM Debate、AFlow、MAS-GPT 等 20 多种多智能体方法,为广大研究者省去复现烦恼!

✅ 评估准:统一输入预处理、LLM 配置、评估协议,确保横评公平性与可重复性!

✅ 结构清晰:统一方法实现结构,新手也能轻松上手,轻松拓展!



📊 跨域横评,真实力一目了然!


研究者们利用 MASLab 进行了大量实验分析,覆盖 10 余种评测基准(MATH、GPQA、GAIA 等),包括 LLaMA-3.3、Qwen-2.5 系列、GPT-4o 等 8 大主流模型,首次系统地刻画大模型多智能体(MAS) 方法在多个任务维度下的性能图谱。 




通过大量实验,为广大研究者们展示了当前多智能体系统方法的发展现状、有劣势等。



MASLab 研究团队不仅紧跟多智能体(MAS)领域前沿,更基于现有成果,创新性地提出了更高效的 MAS 方法 ——MASLab-ReAct。该方法支持搜索、读图、读语音等多种工具,并在 GAIA 验证集上取得了更优结果!实验数据更是有力证明,尤其在需要代码执行、图像解析等工具调用能力的场景下,MAS 展现出无可比拟的显著优势,预示着其在真实世界应用中蕴藏的巨大潜力!


🔍 多维剖析:不只是简单跑跑实验!


MASLab 进一步探索:


⚖️ 仅因评估协议不同,不同 MAS 方法排名可发生巨大变动!


MASLab 研究团队探讨了不同 MAS 方法使用的评估协议,实验证明 —— 评估方式选择,直接影响科研结论!这一结果直接地证明了 MASLab 这一统一代码框架对多智能体领域的重要性!



🧬 扩展性分析:


考察不同多智能体方法 Test-time Compute 的拓展性:



考察不同模型尺寸(7B~72B)对多智能体方法表现的影响:



💥 失败分析:详细追踪格式错误、工具调用失败等常见问题源。MAS 系统的表现不仅依赖模型聪明,更依赖其是否能听懂指令



💬 共建未来:开源共享,共创智能新生态!


MASLab 不是闭门造车的项目,而是为社区而生的开源平台,欢迎社区贡献!共同打造 MAS 的标准实验平台!


未来 MASLab 将持续开源更多方法与基准,推动构建真正可持续发展的 MAS 研究社区!


🚀 MASWorks 大模型多智能体开源社区


与此同时,MASLab 研究团队近期发起了一个全新的倡议 ——MASWorks 开源社区!愿景是连接全球研究者,汇聚智慧,一同分享、贡献与协作,共同推动 MAS 领域的蓬勃发展。


作为社区启动的首个重磅活动,MASWorks 将在 ICML 2025 举办聚焦大语言模型多智能体的 Workshop:MAS-2025!期待全球广大学者的积极参与,共同探讨、碰撞思想,描绘 MAS 的未来蓝图!


MASWorks:https://github.com/MASWorks MAS-2025  

ICML 2025 Workshop on MAS:https://mas-2025.github.io/MAS-2025/


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


文章原文

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MASLab 多智能体系统 开源 大模型
相关文章