36kr 04月01日 20:23
智谱发的“干活Agent”,不用邀请码
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

智谱AI在DeepSeek R1之后推出了“沉思”——一个具备深度思考能力的Agent产品,旨在展示其模型实力。该产品能够理解、分析和搜索信息,甚至访问非公开数据源,并具备多模态理解能力。尽管目前仍处于预览版阶段,但“沉思”展现了智谱在AI Agent领域的探索,并强调了模型在应用中的核心地位。同时,智谱也开源了推理模型GLM-Z1-Air,以应对“后DeepSeek”时代的竞争。

🧠“沉思”作为智谱AI推出的Agent产品,其核心在于展现模型的深度思考能力。它能够理解问题、拆解问题,并通过信息检索和解决方案框架的构建来展现思考过程,更侧重于展现模型本身的智能。

🔍“沉思”具备强大的信息处理能力,能够访问包括知网、小红书等非公开API的信源,并具备多模态理解能力,可以理解网页上的图文信息,这使得它在信息获取和分析方面具有显著优势。

💡智谱AI强调模型在未来应用中的核心地位,认为应用将以模型为核心,产品化将变得更轻量。 这也促使智谱开源推理模型GLM-Z1-Air,以提升推理速度和降低成本,应对市场竞争。

⚙️“沉思”的发布也反映了智谱对AI Agent的探索和思考。 智谱认为,Agent需要具备实时联网搜索、动态工具调用、深度分析和自我验证能力,以保证交付的可靠性和实用性。

文|周鑫雨

编辑|苏建勋

交出后DeepSeek R1时代的答卷,对如今的六小虎而言,显得尤为重要。

DeepSeek R1和Manus,已经分别在推理模型和AI Agent领域炸了场。对于后来者而言,跟随是最为保守的路径。比如,百度发布了推理模型文心X1,腾讯上线了混元深度思考模型T1。

在3月31日的OpenDay上,在国内资本市场拿钱到手软的智谱,开年交出的答卷则是R1和Manus的“plus版本”——具有深度思考能力的Agent产品,“AutoGLM 沉思(以下简称‘沉思’)”,已经免费上线。

AutoGLM沉思。

智谱旗下的初代AutoGLM,曾在2024年11月,实现了第一个由AI发出的红包:AI发了人类历史上第一个红包。“沉思”的班味儿则更重些。就像一位人类实习生,它能够基于开放的自然语言问题,理解、分析、搜索信源。

并且比“联网搜索”更进一步,“沉思”能查看如知网、小红书、公众号、京东、巨潮资讯等不对外开放API的信源,同时具有多模态理解能力,能够理解网页上的图文信息。

张鹏展示的一个案例是:用“沉思”运营小红书账号,两周涨粉5000,还接到了商单。

小红书起号的关键,一是更新频率高,二是话题吸引人。只要输入想讨论的热门话题,比如“手冲咖啡全套设备种草攻略”,“沉思”就能从小红书、知乎等平台,根据上百个信源自动做好了总结。

智谱用“沉思”运营的小红书。

DeepSeek App一举创下3000万日活的神话后,AI厂商对产品范式的认知,逐渐有了变化:应用的最终形态,就是模型;所谓的应用,也成了模型能力的秀场

可以明显感受到,“沉思”的交互界面设计,相较于Manus,更突显了模型本身的思考能力。

在思考过程中,“沉思”展现的是“思考”,从理解问题、拆解问题出发,通过信息检索,再列出解决方案的框架。而Manus着重展现的是“行动”,可视面板显示的是AI调用工具的过程。

“沉思”和Manus的界面对比。上为“沉思”,下为Manus。

“沉思”和Manus的界面对比。上为“沉思”,下为Manus。

比起具有“成为全球首款通用智能体”野心的Manus,“沉思”对于当下智谱的意义,比起可用和落地,在于通过秀出思维链,展现其模型实力。

智谱AutoGLM负责人刘潇也直言,虽然“沉思”能够执行研报整理等简单任务,但当前提供给大众的,只是一个预览版本,还有很多的不足

一个直观的对比是,Manus通过调用Claude的Computer Use能力,能够实现跨PC、App等多端的操作,并且交付出PPT、网页等拥有具体形态的结果。

比如,输入Prompt“请制作一个jellycat主题的吃豆人网页游戏,素材颜色饱和度不要太高”,Manus能直接交付一个像模像样的游戏网页(虽然执行时间长达45min,且游戏存在bug)。

Manus交付的吃豆人网页游戏。

但当前的“沉思”预览版能交付的,仍然是类似于Deep Research(OpenAI推出的研究智能体)的研究整理,无法开箱即用。

输入上述的Prompt,“沉思”只能输出实现游戏的代码,用户还需要额外复制和运行,对非技术背景的用户并不友好。

“沉思”交付的是游戏代码。

一名智谱员工告诉《智能涌现》,“沉思”仍是一个试验性产品,“‘沉思’还不能跨端操作,如果要实现这点,就必须集成GLM-PC(智谱推出的电脑操作模型)等类似Computer Use的功能。”

在Agent上下了一番功夫,智谱想要展示的到底是怎样的技术实力?

OpenDay上,张鹏解析了实现“沉思”所需的模型组合:基座模型GLM-4-Air-0414,推理模型GLM-Z1-Air,以及沉思模型GLM- Z1——这三款新模型,分别对应Agent所需的语言理解、问题分析,以及反思验证能力。

“沉思”背后的新模型。

值得一提的是,智谱提出了“沉思大模型”的概念,这也代表了智谱对R1下一阶段的探索。在张鹏看来,单纯依赖内部知识推理,让传统AI具有相当大的局限性。

比带有局限性的推理更进一步,“沉思”要求AI能够实时联网搜索、动态工具调用、深度分析和自我验证,进而保证交付成功的可靠性和实用性。

“价格屠夫”DeepSeek的掀桌,同样在逼迫后来者或是开源,或是提供更高性价比的模型。

智谱新发布的三款模型中,推理模型 GLM-Z1-Air的推理速度相比R1提升了8倍,但成本仅有1/30,还能在消费级显卡上运行。与此同时,这三款新模型也将在4月14日悉数开源。

当然,身处“后DeepSeek”时代,思考是否坚持预训练、如何做商业化,是如今六小虎不得不回答的问题。

以下是智谱CEO张鹏在发布会上,关于Agent和模型技术,以及商业化的一些思考,略经《智能涌现》编辑:

欢迎交流!

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

智谱AI AutoGLM AI Agent 模型 开源
相关文章