AI圈正迎接新一轮的技术爆发期,DeepSeek以深度推理模型R1震撼海内外,OpenAI、Anthropic、谷歌、阿里、字节、百度等纷纷推进自家大模型的新动态。模型层之外,应用层也开始多了些新变化。
最近的创新来自一家由中国90后创始团队推出的新产品——一款号称通用AI Agent的应用工具Manus。
Manus的官网给出了一些例子可以供我们更加直观的了解Manus的能力,可以看到它的功能在官方演示中确实特别强大,目前Manus的使用需要提前获取邀请码。
有必要简单介绍一下Manus。与传统AI助手相比,类似豆包、Kimi、DeepSeek这些,其局限于信息检索与建议交互,而Manus首次实现“自主执行复杂任务→交付完整成果”的闭环能力,填补了当前市场空白。
另外一点是通用性定义的突破:跨领域处理复杂任务,打破垂直赛道AI的局限性,这是惊艳的前两点。第三点是Manus是继中国团队做出来DeepSeek之后的又一力作,定位为“手脑并用”的通用助手,强调“输入需求→输出结果”的无中介执行模式,命名源自拉丁语“Mens et Manus”,技术理念主张“Less structure, more intelligence”,减少预设流程依赖,强化模型自主进化能力。
一、Manus的优缺点
总结一下Manus的核心优势:
全流程自主执行:从需求分析、任务拆解到成果交付无需人工干预。
多工具链整合:支持浏览器操作、编程工具调用、跨平台数据抓取,实现复杂操作。
覆盖教育、金融、人力资源、企业服务等多领域。
跨领域协同:可同时处理比如简历筛选与房产选购两类异构任务,体现通用Agent特性。
多Agent协作系统:规划、执行、验证三模块分立,云端虚拟机并行处理任务,提升容错率。
上面是Manus的优势,同样Manus也有一些劣势:
依赖预设流程框架:部分任务需在浏览器与操作系统间的“受限环境”执行,无法适配未预定义的应用程序。
执行稳定性问题:用户反馈存在崩溃前生成虚假结果等不可控行为。
高炒作热度导致早期用户预期与实际能力落差,部分场景仍需人工修正输出结果。
企业端部署成本:云端虚拟机运行模式对算力需求较高,限制中小型企业使用。
自主签署合同的法律效力尚未明确,隐私数据跨平台调用可能引发合规争议。
职场替代焦虑:80%中低频白领工作面临被低成本AI替代的风险。
二、Manus究竟做了哪些技术创新?
说完优缺点之后,我们再重点看一下使得Manus这么强的背后技术创新,究竟是什么。
1. 多智能体协作系统
三层架构设计:
规划代理:采用蒙特卡洛树搜索算法动态拆解任务优先级,支持实时调整执行路径。
执行代理:整合200+工具接口,通过浏览器自动化引擎模拟人类操作,但受限于未开放API的CS架构应用。
验证代理:部署对抗性测试模块,检测逻辑矛盾。
多重签名系统:由多个独立模型协同处理子任务,通过交叉验证提升结果可靠性。
2. 动态训练与优化机制
实时反馈迭代:用户可通过“动态培训”功能修正输出格式或调整执行路径,模型即时更新策略。
崩溃恢复技术:任务中断时自动生成替代方案,并保留进度至本地缓存。
3. 工具链深度整合
浏览器沙箱技术:在隔离环境中运行跨平台操作,避免用户隐私数据泄露。
记忆偏好系统:持续学习用户习惯,占用云端存储资源形成个性化执行策略。
4. 性能验证体系
GAIA基准测试突破:在三级测试中分别达86.5%/70.1%/57.7%,超越OpenAI的DeepResearch模型,接近人类水平。
真实场景验证:在Upwork平台完成设计类任务、Kaggle竞赛中实现数据分析自动化,验证跨领域执行能力。
如果上面Manus的技术创新让你眼前一亮,这个时候你是不是会有一个疑问,为什么是Manus?其他AI厂商,尤其是科技大厂为什么没有做出这样的成果,是其他厂商不具备这样的能力吗?目前来看,原因或许有以下几种因素:
1. 技术路径依赖。
模型规模优先策略:OpenAI等厂商聚焦于扩大模型参数量,未将工具调用能力作为核心研发方向。
规则工程惯性:传统AI产品依赖预设流程,难以适应Manus倡导的“Less structure, more intelligence”理念。
2. 工程化挑战。
多工具接口适配成本:需为浏览器、办公软件等开发专用驱动,大厂不愿干脏活累活,其他小厂商又缺乏生态整合能力。
长周期任务管理难题:传统模型受限于会话式交互,难以实现“用户离线后持续执行跨日任务”的异步工作机制。
3. 市场定位差异。
B端服务壁垒:微软Copilot等产品聚焦Office场景,缺乏跨领域泛化能力。
伦理风险规避:头部厂商忌惮自主决策引发的法律争议,选择保守技术路线。
三、Manus的后续改进和行业影响
针对目前Manus表现出的一些缺点,我们认为它未来的改进点如下:
增强环境适应性:突破浏览器/操作系统的“夹层”限制,实现更底层的系统权限调用。
降低算力依赖:通过模型压缩与边缘计算结合,推动中小型企业普及。
优先落地场景:企业自动化办公、教育个性化教学。
开源生态建设:开放部分模型接口,吸引开发者构建插件生态。
建立AI执行审计机制:对自主决策过程留痕,明确错误结果的责任归属。
数据安全规范:限制敏感信息的跨平台流转权限。
但不容忽视的是,Manus的出现肯定会对其他厂商带来一些影响:倒逼OpenAI等厂商加速从“对话式交互”转向“任务执行型”产品开发的节奏,加速Agent技术迭代;推动多模态交互、工具调用API集成成为AI产品新基准。
根据Manus计划,后续官方还将开源推理模块,有望借此催生基于其技术栈的二次开发社区。
Manus需求爆火,还可能带动边缘计算设备需求激增,使得AI终端部署从云端向本地延伸,一批国产硬件厂商也有望从中受益。
AI的发展速度正推动各行各业重新洗牌,未来不是属于资产的时代,也不是属于权力的时代,未来将是属于科技的时代。