原创 镜山 2025-03-31 20:39 北京
AutoGLM 沉思的核心驱动来自于智谱清言最新研发的智能体「大脑」—— 沉思模型。
2025 年,必然是 AI Agent 的「激战之年」。
3 月初,Manus 的发布像是一个发令枪,它告诉所有的 AI 从业者,不必痴迷于技术底层,也可以做出令所有人感到惊叹的 AI Agent 产品。
从 ChatBot 到 Agent,2025 年将是 toC 的 AI 产品交互范式转变之关键时刻,十字路口会跟进观察和分享在「Agent 激战之年」的各种新战况。
在今日的中关村论坛上,智谱在「AI 六小龙」中,率先推出了自己的智能体产品,名字叫做: AutoGLM 沉思。
它不仅拥有深度研究能力(Deep Research),还能执行具体操作(Operator),是典型的 「边思考边行动」的一个 AI Agent。
在「十字路口」前不久的重磅内容《AI Agent 20问》中,我们用 20 组精心铺陈的问题,尝试和大家一起搞懂 AI Agent 的前世今生、技术突破、未来潜力。因此,在收到邀请体验 AutoGLM 沉思的测试后,我们在十字路口会员群里一起内测、讨论,明显能感觉到这段时间大家对于各种 AI Agent 产品的热情。
虽然 AutoGLM 远远没有掀起如 Manus 般的讨论热潮,在会员群中的讨论也褒贬不一,但我们看完各种报告后,仍然认为「沉思」这是一款值得被了解、被试用的产品。
「AutoGLM 沉思」能够应对复杂的开放性问题,通过实时推理与搜索,快速浏览网页,最终生成长篇报告,并附上引用来源,确保内容的透明性和可验证性。
国内 AI 产品一直以来都以「慷慨」著称,不管是 Kimi 还是海螺,亦或是增加了深度思考功能的豆包或夸克,再到今天智谱发布的 Agent 沉思,几乎都是免费提供给用户们。
沉思现已全面登陆智谱清言的网页版、PC 端和手机 App,可以免费、无限制地体验。
再次强调,关键是:免费、不限量。在客户端点击左侧「AutoGLM 沉思」,即可调用。
能够应对复杂任务的智能体与普通人之间,不应该有付费的「隔离」。
1. AutoGLM 沉思
复盘智谱的技术路线, AutoGLM 沉思的技术发展历程经历了多个阶段:从 GLM-4 基础模型起步,逐步演进至 GLM-Z1 推理模型,再到 GLM-Z1-Rumination 沉思模型,最终形成如今的 AutoGLM 模型。
智谱计划于 4 月 14 日将其中关键模型和技术开源,以促进整个行业生态的繁荣与进步。
秉持「让机器具备人类般的思维能力」的愿景,智谱始终致力于 AGI 基础模型的研发,目前已达到 L3-Agentic LLM 的技术水平。
AutoGLM 沉思的核心驱动来自于智谱清言最新研发的智能体「大脑」—— 沉思模型。
这款模型通过强化学习,赋予了 AI 自我批评、反思甚至深度沉思的能力,从而实现长链推理和任务执行的高效结合。其技术根基是智谱自研的全栈大模型体系,融合了 GLM-4 的通用基础能力、GLM-Z1 的反思机制、GLM-Z1-Rumination 的沉思特性,以及 AutoGLM 的自动化操作实力。
我们总结了下沉模型的技术架构。可以说,AutoGLM 沉思的关键在于:
全新基座模型 GLM-4-Air-0414
全新深度思考模型 GLM-Z1-Air
沉思模型GLM-Z1-Rumination
智谱先推出了全新基座模型 GLM-4-Air-0414,拥有 32 B 参数。为了适配智能体,他们在预训练中加入更多代码和推理数据,并在对齐时优化了工具调用、联网搜索和代码生成能力,让模型在智能体任务中表现更强。
基于此,智谱增加了推理数据并提升通用能力,推出了深度思考模型 GLM-Z1-Air。
接着,以 GLM-Z1 为基础,通过强化学习扩展训练,增强了模型的长程推理和工具使用能力,打造出沉思模型 GLM-Z1-Rumination。
至此,组成 AutoGLM 沉思的三块拼图完成。
2. 实例
AutoGLM 沉思官方有数个例子。
首先是电子产品对比。
比如,输入提示词:
帮我比较两款产品:我在考虑购买Macbook Air 和 小米笔记本。需求:—我经常出差,需要电池续航长、重量轻的笔记本,也关注性能和售后服务。请从规格参数、电池续航测试、用户评价等方面比较A和B,列出各自的优缺点,并根据我的需求给出推荐。
智谱清言输出了详尽的总结。
其次是,生成式 Al 技术影响。
输入提示词:
生成式 AI 技术对未来知识生产模式的颠覆性影响。具体要求:对比传统学术研究与 AI 辅助研究的范式差异选取至少 5 个典型领域(如医学、法学、文学,经济学,艺术学等)进行深度研究案例分析,字数要求一万字以上
由于提示词内具有对内容专业性的要求,AutoGLM 沉思能够调用 arXiv 内容,生成附带详尽文献参考的技术报告。
再比如,香港旅行攻略。
AutoGLM 沉思能够自动浏览小红书平台内部内容,最终设计出一份有详细依据作为基础的旅游攻略。
输入提示词:我要去香港玩3天,请帮我设计旅游攻略,注意每个景点都要从小红书上查看网友的真实评论。
除开智谱本身所给出的示例,为了测试它的深度研究和实际操作能力,我输入了一个相对复杂的 Prompt:
”帮我分析 2025 Q2,各家互联网大厂在 AI 方向可能会有的大动作。“
收到指令后,AutoGLM沉思迅速启动了分析模式。它先是梳理了当前AI领域的技术热点和各大互联网公司的关键产业信息。
随后通过联网搜索,浏览了数十个网页,包括行业报告、新闻动态和专家评论等。
经过长时间的思考后,最终,智谱经过「沉思」,给出了一份长长的报告。
通过简要地对智谱的 AutoGLM 沉思所给出的研究计划进行整理,可发现,沉思会给出清晰的研究计划的结构与目标:
明确研究对象
信息收集
技术趋势分析
策略预测
综合报告
全程无需人力监督,它就能够自动输出一个逻辑清晰、结构完整的研究框架,具体目标明确且层次分明。
从输出报告最后的文章信息来源来看,短短几种分钟内,智谱 AutoGLM 沉思查阅了包括 PDF、知乎、新闻门户网站等多种信息来源,共计 84 条信息来源,完成了对海量信息的检索和整合。
这一过程完全自动化,它能够迅速从纷繁复杂的网络数据中筛选出关键点,梳理出逻辑清晰的分析框架。高效的搜索与总结能力,实现了从信息采集到成果输出的无缝衔接。
3、2025 年注定是 AI Agent 腾飞的一年
今天的发布,智谱的战略重心也越来越明显:在 Agentic GLM 的开发上突破,加速 Agent 的落地。
在技术层面,智谱依靠自研的大模型技术,持续深耕既有逻辑推理和深度思考能力的 Agent 基座模型,同时推进通用基座模型的优化,再到智能体框架的设计与应用落地,逐步实现让机器具备类人思考和行动能力的愿景。
此外,智谱计划打造 Agentic LLM 平台,为生态伙伴提供支持,让他们能够借助智谱模型和智能体的强大功能,开发出深度契合行业、地域及场景需求的智能体应用。
我们都记得 Manus 问世的那个凌晨带给我们的震撼,AI 技术的边界被重新定义。
希望智谱借「AutomGLM 沉思」打响的 AI 六小龙第一枪,能让 2025 年的 AI Agent 激战变得更加精彩。
加油吧,智谱!