AI大模型工场 05月08日 15:17
MCP:大模型时代的真正船票
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文探讨了Agent+MCP模式在大模型领域的意义,认为它类似于移动互联网时代的iPhone+iOS。文章分析了Manus的成功,指出其本质是基座模型+接口协议+调用工具的自主工作流。同时,对比了字节Coze和纳米AI,认为纳米AI通过自建MCP开放市场,建立本地客户端+MCP自由调用市场,一个类似App Store的开放生态,直指普通人用的超级智能体,可能是大模型To C的未来方向。

🔥Agent+MCP模式的出现,意味着大模型正在以接近人类的学习和工作方式,完成真实世界的复杂任务,预示着大模型To C的趋势可能碾压一切。

🛠️Manus通过基座模型+接口协议+调用工具的自主工作流,找到了让普通人最舒服使用大模型的方式,用户可以用自然语言让大模型完成任务,无需繁琐的Prompt。

🌐纳米AI通过自建MCP开放市场,建立了本地客户端+MCP自由调用市场,用户可以自由调用和组合MCP工具,自建Agent,打造类似App Store的开放生态,为大模型To C提供了新思路。

2025-04-28 17:14 北京

大厂纷纷布局



作者Jeff

编辑|研究媛

媒体|X研究媛



很多人还在争论Manus是否“套壳”的时候,却没有察觉到到Agent+MCP意味着什么。


Agent+MCP,自主探索、深度思考、调用工具,以接近人类的学习、工作方式,完成真实世界的复杂任务。


今天MCP的热潮很像十几年前iPhone+iOS,那个iOS生态的起点,少有人意识到移动互联网时代的大浪滚滚而来。个人判断:MCP共识一旦形成,大模型To C的趋势,将碾压一切。



Manus进行「封闭验证


在一个资本高度关注、全球大热的领域,一个名不经传的团队,做出一个现象级产品,大概率是击中了PMF,为所有还困在森林里的探险者找到了路。


Manus现象大概就是创业最经典的“轻量级验证”。这家公司以它自己为模板,为行业验证了潜在的、极其庞大的需求。而且这大概率是冲着传统搜索引擎。


Manus是什么?Manus为什么能火?它就是找到了让普通人最舒服使用大模型的方式。“通用Agent”无论这个牛逼概念能不能兑现,能“通用”到什么程度,Manus能一句话,用户能以“自然语言”说人话的方式,让大模型把一个事情从头到尾做完。


按时髦的说法,大模型“端到端”把活干完了,这才是普通人真正需要的东西!


但是人们发现,火出圈的Manus 居然没有自研大模型,只是一个模型和工具的“包装器”,套壳的质疑并非完全是污蔑。


Manus本质是基座模型+接口协议+调用工具的自主工作流。Manus 使用Claude为底座模型和阿里云通义实验室研发的Qwen-finetunes微调工具,CodeAct作为调用工具的“接口协议”,关键差异在,Manus还打包了29个大模型调用的、精心筛选的工具。


按类别来分,Manus集成了12个浏览器操作工具(browser系列,支持AI代理与浏览器、网站交互);5个Shell操作工具(用户与操作系统内核之间的接口,允许用户通过命令行界面与系统进行交互);5个文件操作(file系列,支持打开、读取、写入、创建文件等等);3个部署工具;2个message消息交互工具;1个信息查询工具info_search_web和1个idle工具。



Manus究竟有什么独特之处?调用工具其实也不是重点,Function Call早就有人提出了。自主工作流,拆解目标、层层推进、反思迭代、输出结果,也并不是破天荒。从o1到R1,从预训练Scaling 到后训练Scaling 甚至推理步骤和时间上的Test-time Scaling,推理式LLM能力也已具备。


但是推理式LLM+自主调用工具,产生了质变。



Coze首测,MCP to B


MCP是推理式LLM调用工具的关键。

MCP作为一个统一的“工具”生态,全球性的共识正在形成。打一个比喻,如果MCP的工具生态就像iOS平台刚刚诞生那会,而谷歌的A2A,就像就在这个关键节点,搞出了Android。

MCP的起源,Anthropic发明MCP核心工程师的说法,为了给自家已经很棒的大模型延展更多的功能,他们在Cloud Desktop和IDE之间来回复制粘贴,不胜其烦。他们给出的解决方案是:给大模型配一台“云电脑”,把已开发的多个大模型调用的Function,和想获得的多个外部功能、数据在这台“云电脑”环境上集成、打通、运行,一个典型的“M X N"问题,使用一个标准协议解决。

MCP运行涉及到Host、Client和 Server。Host简单理解就是调用工具或外部数据的“需求发起方”,它可以是一个大模型聊天对话工具或者专业的IDE。Client则是负责连接Host与Server的「客户端」,比如Cursor;Server就是需要扩展的外部功能或外部获得的上下文数据。

一个简单的MCP运行过程,Host发出需求指令,Host的指令通过 Client 和 外部的Server 沟通,最终实现功能并返回结果给用户。


相比 Manus演示了推理式LLM工作流+自主调用工具的思路,使用了CodeAct而非MCP做协议,并且调用的工具基本是定制好了,数量也限死。

字节Coze更进一步,开始扩展可以调用的工具,并且瞄准办公场景。

4 月 18 日周五晚,字节的 Agent 产品 “扣子空间” 开启内测。团队为此准备不少算力资源,但短短几小时内,服务器就被涌入的用户挤爆。超出预期的用户热情,让扣子团队再次验证一个判断:用户一直在等待能用的 AI 产品,去解决工作中的问题。


Coze Space是什么?


Coze Space 按字节官方说法「一款AI Agent协作办公平台」,旨在通过AI驱动的代理和模块化工具优化工作流程,被定位为“用户与AI Agent协作的理想场所”。它支持从任务分析到执行和结果生成的全流程自动化,提供两种模式:


平台集成了60多个MCP扩展,包括飞书多维表格、高德地图、图像工具和语音合成等,支持数据分析、地理规划、内容创作等应用场景。它提供低代码/无代码环境,非技术用户也能通过自然语言构建AI应用。


纳米AI,MCP to C时刻



有了封闭产品、调用有限和固定工具的Manus,有了Coze半开放的协作智能体工作流,还会出现什么?


2025年4月23日,纳米AI正式上线MCP技能商店,按官方说法,建立起像DeepSeek等基座大模型的“万能工具箱”。基于本地客户端,而不是Coze或者Manus的云端Host,纳米AI客户端有4亿月度访问用户,选择面向普通用户,目前只有它一家。


周鸿祎不做只有29个固定工具的Manus,也不做只有60个MCP扩展、半开放协作智能体工作流Coze。一步到位,直指普通人用的超级智能体:调用工具更多、更自由、高度开放场景的MCP to C。


纳米AI不同于Manus和Coze集中在开发者圈子,相对封闭产品体系,纳米AI自建了MCP的开放市场,思路类似iOS App Store。


纳米AI通过自研MCP工具,逐一审核引入外部高频使用、有口碑的MCP应用并且限时免费接入,以及扩容第三方MCP Server的方式,建立起一个初步MCP应用生态,让大模型可以调用超过100个仔细筛选、高质量、真实有用的MCP技能应用,用户可以手搓自己的超级智能体!


这些MCP在被LLM调用,多个技能并行运行时,能够模仿人类在真实世界完成工作,覆盖任务的更多样性、泛化性尤其突出。


作为首批实测纳米AI超级智能体用户,笔者一个实测案例,创建“生成网页”的个人智能体:




在创建好了智能体后,我让它进行“特朗普关税影响”的深度报告生成和网页代码生成。



最终生成的网页 https://mzbx47.n.cn


从实测效果看,这是全网第一个不需要调试代码,不需要MCP工具调用配置,不需要掏钱买Key连接第三方高质量 MCP Server,只要会写Prompt和选择合适的MCP工具,就可以生成个人专属智能体的平台。


如果用户不会写Prompt,也不知道该选择哪个工具,可以直接使用官方的模板智能体。就像在App Store选择应用一样,一键下载、配置、使用。



按照纳米AI的设想,通过MCP集成大量生态伙伴,让大模型和MCP工具技能自由组合,超越Coze和Manus的能力上限。目前,纳米AI能够自动分析用户需求并拆解为多个子任务,自主调用工具(如浏览器、代码编辑器等)执行任务,并输出完整的结果报告,如网页、PPT、Word文档等。


纳米AI比较独特之处,可以通过MCP读取本机数据库,自动调用纳米AI集成的本地浏览器,跨过登陆墙调用应用执行应用内多步操作,让大模型和智能体能够完成此前无法完成的复杂功能。


这背后是360团队过去在搜索和浏览器的技术积累。根据笔者跟相关产品和研发的深入交流:


“ 一方面基于360团队过去在搜索上的深厚积累,自建了千亿级的索引库和百亿级精品库。另一方面,加入了更多MCP协议的搜索工具,如Tavily Search , Exa Search ,Github, Google Scholar, ArXiv和PubMed,雅虎财经,包括学术、医学、科学论文、代码等高质专业数据来源,大大提升了大模型专业知识搜索的广度和深度。得益于纳米AI的开放式设计,接入的MCP Server越来越多,专业内容搜索能力会越来越强。


纳米AI专门也打造了一个最能适应中国网络特色的AI爬虫。与通用爬虫不一样的是,基于360搜索过去搜索爬虫能力,纳米AI是专门为大模型打造的爬虫,它能够读懂各种复杂的页面结构,包括各种信息流网站、视频网站、社交网站的动态网页代码,让大模型可以提取网页正文、图片、视频、音频等资源。


还有客户端集成了首个为大模型定制的AI浏览器。纳米AI打造了一个大模型专用的浏览器,而且该浏览器的大模型调用基于本地计算机上运行,它实现多个社交网站的深度搜索和深度理解,打破登录墙和内容围栏,帮你在多个网站中找到信息、找到用户评论,找到贴子里的图片和视频。最终检索出更全面、更高效和精准的信息。


目前,纳米AI支持的MCP工具数量最多、客户端体量最大,也是首个可自由调用和组合MCP工具、并且支持用户自建Agent的平台。纳米AI选择了 MCP to C的道路,建立起本地客户端+MCP自由调用市场,一个类似App Store的开放生态。


后续,开发者还可以在纳米AI平台上架自己的MCP工具,并且获得终端用户的付费收入,一个平台、开发者、用户形成完整闭环,可持续的商业模式。完全就是iPhone+iOS的思路!


周鸿祎成名于PC时代,错过了移动时代,但在大模型时代,卯足劲要拿到一张船票。


可能地火已经无法压制。MCP to C,一座火山已经突出了地壳,即将喷发。


AIGC大模型工场已经组织了非常精准的「AI大模型垂直社群」,覆盖超1000位AIGC圈,百度大模型业务负责人,京东大模型业务负责人,腾讯大模型业务人,阿里云大模型技术负责人,科大讯飞大模型公关,商汤大模型业务,阅文大模型公关,360大模型公关负责人都在群里啦,欢迎大模型业务负责人加入。请加微信fqq2000nian,注明真实身份。




数据支持天眼查,大模型独家合作账号

— END —

监制 / 刘老师
编辑 / AIGCCCCC
视觉 / 大模型
微博 / @AI大模型工场
TG/AI  Marketing Field

 


大模型应用创业者,你怎么看

■ 百度文心一言 阿里通义千问 ▍通用大模型案例
■ 科大讯飞星火 京东 ▍产业大模型案例
■ 商汤日日新,腾讯,昆仑万维 ▍ 金融大模型案例
■ 盘古大模型,中国电信,医联 ▍医疗大模型案例
■阅文大模型,腾讯音乐大模型 ▍文娱大模型案例
■知乎,360大模型,火山引擎 ▍ 教育大模型案例
■  网易,金山办公大模型 ▍更多行业大模型案例



上次介绍一码难求的字节版Manus,用起来能有多爽?(内附邀请码)





本文由大模型领域垂直媒体「AI大模型工场」

原创出品,未经许可,请勿转载。

/

欢迎提供新的大模型商业化落地思路

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MCP Agent 大模型 纳米AI Coze
相关文章