智源社区 03月09日 00:16
OpenManus:又一Manus 开源复刻,MetaGPT团队5个人三小时完成开发
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

一夜爆红的Manus通用智能体有了开源复刻版OpenManus!仅用3小时,一个由5人组成的团队便完成了OpenManus的开发,无需排队等待,完全免费。OpenManus通过模块化Agent系统、实时反馈机制和强大的工具链,实现了对Manus的复现。其核心设计在于模块化Agent系统,开发者可以自由组合不同的功能模块,创造独特的AI助手。OpenManus的思维过程公开透明,方便人类适时干预,从而更高质量地完成任务。此外,OpenManus还配备了一系列“外援”工具,如浏览器自动化、代码执行器和文件处理等,以完成复杂任务。OpenManus的火速上线,得益于MetaGPT积累的技术沉淀。

🤖 OpenManus的核心在于其模块化Agent系统,开发者可以根据需求自由组合不同的功能模块,从而创造出独特的AI助手。在OpenManus中,不同分工的Agent会协作完成需求理解、规划、行动等任务,例如Manus主代理负责理解用户需求并完成分工,PlanningAgent负责将复杂任务拆解成可执行的步骤,ToolCallAgent则负责掌管各类工具的使用。

👁️‍🗨️ OpenManus的另一关键在于其思维过程是公开透明的,拿到任务后,OpenManus如何思考问题,如何规划执行……全都能实时反馈。这为人类在合适时间进行干预提供了“窗口”,有助于更高质量完成任务。

🧰 OpenManus配备了一系列“外援”工具,为了完成复杂任务,例如浏览器自动化(像人类一样操作浏览器,自动分析网络信息并交互)、各种代码执行器(能够实时生成和执行代码)和文件处理(自动生成和管理各类文档)。各类工具协同设计,底层由各类大语言模型构成,中间层通过多智能体协作拆解任务,执行层调用各类API接口完成具体操作。

感谢开源!

一夜走红的Manus,现在已经有了开源复刻版!

5个人3个小时,一个完全免费、无需排队等待的OpenManus就做好了。

至于复现程度,还是直接看Manus官方和开源团队提供的demo对比。

作为全球首款通用智能体,官方提供的case如下:

而OpenManus团队三小时复刻的成果是酱婶儿的:

效果大家自己感受一下。

对于动手能力强的小伙伴儿,也期待大家自行体验后留言反馈。

Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过审核后工作人员会拉你入群~
进群之后,你有机会得到:

    高浓度的主流模型(如 DeepSeek 等)开发交流;

    资源对接,与 API、云厂商、模型厂商直接交流反馈的机会;

    好用、有趣的产品/案例,Founder Park 会主动做宣传。

01 

从开源反推Manus的实现路径

与此同时,通过深扒OpenManus,我们其实还可以看出一条实现Manus的合理路径。

(当前Manus使用了哪家模型、Agent框架等具体细节处于保密状态)

概括而言,OpenManus的背后有三大关键:

    拥有模块化Agent系统;

    具备实时反馈机制;

    配备了一整套强大的工具链;

展开来说,其核心设计就在这种模块化Agent系统。开发者可以根据需要自由组合不同的功能模块,从而创造出独特的AI助手。

在OpenManus中,拥有不同分工的Agent会协作完成需求理解、规划、行动等任务。

比如Manus主代理就像项目经理,负责理解用户需求并完成分工;PlanningAgent作为规划员,负责将复杂任务进一步拆解成可执行的步骤;而ToolCallAgent则是技术专家,负责掌管各类工具使用。

以上这一套都是靠开源团队曾经提出的MetaGPT(一个多智能体框架)实现,开发者可以自由集成多个合适的大语言模型。

此外,OpenManus的另一关键在于其思维过程是公开透明的。

正如开头提到的例子,拿到任务后,OpenManus如何思考问题,如何规划执行……全都能实时反馈。

这为人类在合适时间进行干预提供了“窗口”,有助于更高质量完成任务。

最后不得不提到Agent对工具的使用。

为了完成复杂任务,OpenManus也配备了一系列“外援”:

    浏览器自动化:像人类一样操作浏览器,自动分析网络信息并交互;

    各种代码执行器:能够实时生成和执行代码;

    文件处理:自动生成和管理各类文档;

    ……

需要注意的是,各类工具都不是单独的模块,而是需要协同设计。

将以上组合在一起,这类多智能体系统的一般架构为:底层由各类大语言模型构成,中间层通过多智能体协作拆解任务,执行层调用各类API接口完成具体操作。

总之,按照OpenManus作者的总结,这一开源成果结合了computer-use、基本的Agents以及融合了规划能力。

正如OpenManus团队在项目致谢中提到的,Claude厂商Anthropic去年上线的computer-use,以及YC投资的项目browser-use,都给OpenManus提供了基础支持。

顾名思义,这两个项目分别被用来操作电脑和浏览器,而在沙盒环境中操纵正是Manus工作的一大核心特征。


02 

5人开发团队,

3小时完成复刻

OpenManus团队只用了1个小时就完成了核心系统,整体也只用了3个小时。

核心作者梁新兵介绍,OpenManus的火速上线,来源于MetaGPT积累下的技术沉淀。

(注:MetaGPT是一个多智能体框架,为了处理复杂任务,将不同的角色分配给GPT模型,形成一个协作性“软件公司”。)

我们只是把浏览器工具链嫁接到过去代码上,配合沉淀的Agent工具包。

几位研发成员,也都是来自MetaGPT团队。

“开源版Devin”——数据解释器(Data Interpreter),也是出自MetaGPT团队之手。

OpenManus核心作者梁新兵,毕业于华东师大,还在读时就参与了Data Interpreter的工作。

另一名核心作者向劲宇,本科就读于西南交通大学应用物理系。

去年,读大四的他和队友一起使用GPT-4与Claude 3组成多智能体的方案,让AI分饰多个角色、相互验证来完成答题步骤,获得了阿里巴巴数学竞赛AI赛道全球第二名。

在MetaGPT社区,向劲宇还和其他成员一起,让智能体成功在“我的世界”当中采集到了钻石。

甚至他还曾经让智能体假扮知乎大V,回答了100多个问题,获得3万余次阅读,还有赞同、反驳甚至私信关注,结果直到他主动停止,AI的身份都未被发现。

张佳钇,去年本科毕业于中国人民大学高瓴人工智能学院,现在是港科大(广州)在读博士,被ICLR 2025接收的智能体框架AFlow,他和向劲宇是共同一作。

于兆洋,张佳钇在人大的同级同学;洪思睿,MetaGPT和Data Interpreter两篇论文的共同一作,DeepWisdom高级研究员,香港科技大学硕士,本科毕业于暨南大学。

AFlow的作者当中,也有于兆洋和洪思睿的名字。

今年,以张佳钇和向劲宇为共同一作,五个人的名字共同出现在了一个名为SPO的项目当中,该项目能够让提示词自我进化,让人们摆脱研究提示词工程的繁琐过程。

并且综合五名作者的经历和署名信息可以推断,除了15年取得硕士学位的洪思睿年龄稍长之外,其余4位作者,几乎都是本科毕业不久,当中有人选择继续深造,也有人加入了DeepWisdom。

开源地址:
https://github.com/mannaandpoem/OpenManus

参考链接:

[1]https://x.com/didiforx/status/1897675038972883408[2]https://www.sohu.com/a/827134153_121798711

[3]https://modelscope.cn/studios/AI-ModelScope/SPO



更多阅读
a16z全球AI产品Top100:中国14款产品上榜,DeepSeek第2,Monica第41
OWL:复刻Manus通用智能体,完全开源!GAIA Benchmark最强性能!
Manus产品负责人张涛万字解析:DeepSeek R1是怎么炼成的?
对话像素绽放PixelBloom赵充:一年内用户超千万,而且挣到钱,AiPPT.cn是怎么做到的?

转载原创文章请添加微信:founderparker

内容中包含的图片若涉及版权问题,请及时与我们联系删除

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenManus 通用智能体 开源复刻
相关文章