AI大模型工场 04月09日 18:05
解密Manus:靠垂直整合,抢在了AI大厂前头
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了通用AI Agent Manus,包括其功能、优缺点、技术创新、未成功原因、改进点及影响。Manus实现自主执行复杂任务的闭环能力,有诸多优势,也存在一些劣势。其技术创新令人瞩目,未成功原因多样。文章还提出了改进点及对行业的影响。

🎯Manus实现自主执行复杂任务的闭环能力,填补市场空白

💪具备多工具链整合等多种优势,覆盖多领域

🚧存在依赖预设流程框架等劣势

🌟技术创新包括多智能体协作系统等方面

📋提出增强环境适应性等改进点及对行业的影响

麦思 2025-03-11 16:37 北京

小团队灵活创新的一次尝试。



作者|麦思

编辑|肖阳

转载来源|直面AI



AI圈正迎接新一轮的技术爆发期,DeepSeek以深度推理模型R1震撼海内外,OpenAI、Anthropic、谷歌、阿里、字节、百度等纷纷推进自家大模型的新动态。模型层之外,应用层也开始多了些新变化。


最近的创新来自一家由中国90后创始团队推出的新产品——一款号称通用AI Agent的应用工具Manus。


Manus的官网(https://Manus.im/usecases)给出了一些例子可以供我们更加直观的了解Manus的能力,可以看到它的功能在官方演示中确实特别强大,目前Manus的使用需要提前获取邀请码。



有必要简单介绍一下Manus。与传统AI助手相比,类似豆包、Kimi、DeepSeek这些,其局限于信息检索与建议交互,而Manus首次实现“自主执行复杂任务→交付完整成果”的闭环能力,填补了当前市场空白‌。


另外一点是通用性定义的突破:跨领域处理复杂任务(如股票分析、旅行规划、代码生成等),打破垂直赛道AI的局限性‌,这是惊艳的前两点。第三点是Manus是继中国团队做出来DeepSeek之后的又一力作,定位为“手脑并用”的通用助手,强调“输入需求→输出结果”的无中介执行模式,命名源自拉丁语“Mens et Manus”(意为手脑并用),技术理念主张“Less structure, more intelligence”,减少预设流程依赖,强化模型自主进化能力。



Manus的优缺点



总结一下Manus的核心优势:


全流程自主执行:从需求分析(如简历筛选)、任务拆解(如房产选购规划)到成果交付(生成Excel/PPT报告)无需人工干预‌。


多工具链整合:支持浏览器操作、编程工具调用、跨平台数据抓取,实现复杂操作(如自动解压简历包并分析)‌。


覆盖教育(教学材料生成)、金融(股票关系分析)、人力资源(候选人分级)、企业服务(自动化周报)等多领域‌。


跨领域协同:可同时处理比如简历筛选与房产选购两类异构任务,体现通用Agent特性‌。


多Agent协作系统:规划、执行、验证三模块分立,云端虚拟机并行处理任务,提升容错率‌。



上面是Manus的优势,同样Manus也有一些劣势:


依赖预设流程框架:部分任务需在浏览器与操作系统间的“受限环境”执行,无法适配未预定义的应用程序‌。


执行稳定性问题:用户反馈存在崩溃前生成虚假结果(如伪造邀请码)等不可控行为‌。


高炒作热度导致早期用户预期与实际能力落差,部分场景仍需人工修正输出结果‌。


企业端部署成本:云端虚拟机运行模式对算力需求较高,限制中小型企业使用‌。


自主签署合同的法律效力尚未明确,隐私数据跨平台调用可能引发合规争议‌。


职场替代焦虑:80%中低频白领工作(如简历筛选、报表生成)面临被低成本AI替代的风险‌。



Manus究竟做了哪些技术创新?



说完优缺点之后,我们再重点看一下使得Manus这么强的背后技术创新,究竟是什么。


1. 多智能体协作系统(Multi-Agent Collaboration)


三层架构设计:


规划代理(Planning Agent):采用蒙特卡洛树搜索(MCTS)算法动态拆解任务优先级,支持实时调整执行路径(例如在简历筛选中优先处理学历匹配度)。


执行代理(Execution Agent):整合200+工具接口(浏览器、Office套件等),通过浏览器自动化引擎模拟人类操作(点击、滚动、表单填写),但受限于未开放API的CS架构应用。


验证代理(Validation Agent):部署对抗性测试模块,检测逻辑矛盾(如财务数据与行业基准偏差超5%时触发复核流程)。


多重签名系统(Multisig System):由多个独立模型协同处理子任务,通过交叉验证提升结果可靠性(例如股票分析中,3个模型独立计算行业关联度,取置信度最高值)。


2. 动态训练与优化机制


实时反馈迭代:用户可通过“动态培训”功能修正输出格式(如指定PPT模板)或调整执行路径(如跳过特定网站数据抓取),模型即时更新策略。


崩溃恢复技术:任务中断时自动生成替代方案(如简历解析失败后改用关键词匹配模式),并保留进度至本地缓存。


3. 工具链深度整合


浏览器沙箱技术:在隔离环境中运行跨平台操作(如自动登录招聘网站抓取简历),避免用户隐私数据泄露。


记忆偏好系统:持续学习用户习惯(如合同模板偏好),占用云端存储资源形成个性化执行策略。


4. 性能验证体系


GAIA基准测试(https://zhuanlan.zhihu.com/p/669652697)突破:在三级测试中分别达86.5%/70.1%/57.7%,超越OpenAI的DeepResearch模型,接近人类水平(90%)。


真实场景验证:在Upwork平台完成设计类任务(如Logo生成)、Kaggle竞赛中实现数据分析自动化,验证跨领域执行能力。



如果上面Manus的技术创新让你眼前一亮,这个时候你是不是会有一个疑问,为什么是Manus?其他AI厂商,尤其是科技大厂为什么没有做出这样的成果,是其他厂商不具备这样的能力吗?目前来看,原因或许有以下几种因素:


1. ‌技术路径依赖‌


‌模型规模优先策略‌:OpenAI等厂商聚焦于扩大模型参数量(如追求GPT-5),未将工具调用能力作为核心研发方向‌。


‌规则工程惯性‌:传统AI产品依赖预设流程(如客服对话树),难以适应Manus倡导的“Less structure, more intelligence”理念‌。


2. 工程化挑战


‌多工具接口适配成本‌:需为浏览器、办公软件等开发专用驱动,大厂不愿干脏活累活,其他小厂商又缺乏生态整合能力(如Manus团队耗时2年完成200+工具接口开发)‌。


‌长周期任务管理难题‌:传统模型受限于会话式交互,难以实现“用户离线后持续执行跨日任务”的异步工作机制‌。


3. 市场定位差异


‌B端服务壁垒‌:微软Copilot等产品聚焦Office场景,缺乏跨领域泛化能力(如同时处理简历筛选与股票分析)‌。


‌伦理风险规避‌:头部厂商忌惮自主决策引发的法律争议(如合同签署效力),选择保守技术路线‌。



Manus的后续改进和行业影响



针对目前Manus表现出的一些缺点,我们认为它未来的改进点如下:


增强环境适应性:突破浏览器/操作系统的“夹层”限制,实现更底层的系统权限调用‌。


降低算力依赖:通过模型压缩与边缘计算结合,推动中小型企业普及‌。


优先落地场景:企业自动化办公(智能客服、合同审核)、教育个性化教学(动态生成课件)‌。


开源生态建设:开放部分模型接口,吸引开发者构建插件生态(如第三方工具集成)‌。


建立AI执行审计机制:对自主决策过程留痕,明确错误结果的责任归属‌。


数据安全规范:限制敏感信息(如简历、财务报表)的跨平台流转权限‌。


但不容忽视的是,Manus的出现肯定会对其他厂商带来一些影响:倒逼OpenAI等厂商加速从“对话式交互”转向“任务执行型”产品开发的节奏,加速Agent技术迭代‌;推动多模态交互(文字/图表/代码混合输出)、工具调用API集成成为AI产品新基准‌。


根据Manus计划,后续官方还将开源推理模块,有望借此催生基于其技术栈的二次开发社区‌。


Manus需求爆火,还可能带动边缘计算设备需求激增,使得AI终端部署从云端向本地延伸‌,一批国产硬件厂商也有望从中受益。


AI的发展速度正推动各行各业重新洗牌,未来不是属于资产的时代,也不是属于权力的时代,未来将是属于科技的时代。


AIGC大模型工场已经组织了非常精准的「AI大模型垂直社群」,覆盖超1000位AIGC圈,百度大模型业务负责人,京东大模型业务负责人,腾讯大模型业务人,阿里云大模型技术负责人,科大讯飞大模型公关,商汤大模型业务,阅文大模型公关,360大模型公关负责人都在群里啦,欢迎大模型业务负责人加入。请加微信fqq2000nian,注明真实身份。



数据支持天眼查,大模型独家合作账号


— END —


监制 / 刘老师

编辑 / AIGCCCCC

视觉 / 大模型

微博 / @AI大模型工场

TG/AI  Marketing Field


  


大模型应用创业者,你怎么看


■ 百度文心一言,阿里通义千问   ▍通用大模型案例

 ■ 科大讯飞星火 京东  ▍产业大模型案例

■ 商汤日日新、腾讯,昆仑万维   ▍ 金融大模型案例

■ 盘古大模型,中国电信,医联 ▍医疗大模型案例

■阅文大模型,腾讯音乐大模型 ▍ 文娱大模型案例

■知乎,360大模型,火山引擎 ▍ 教育大模型案例

■  网易,金山办公大模型   ▍    更多行业大模型案例



上次介绍Manus一码难求?更适合企业体质的开源应用在火山引擎!





本文由大模型领域垂直媒体「AI大模型工场」

原创出品,未经许可,请勿转载。 

/

欢迎提供新的大模型商业化落地思路

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Manus AI Agent 技术创新 行业影响 改进点
相关文章