今天，OpenAI彻底颠覆AI助手！ChatGPT智能体上线，融合三大AI

掘金人工智能 21小时前

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

OpenAI发布了具备自主决策能力的ChatGPT智能体，该智能体融合了思考、操作和进化三大AI引擎。它能够独立规划并执行复杂任务，通过调用网页交互、信息搜集和对话能力，成为一个统一的智能体。ChatGPT智能体不仅能进行深入研究、制作演示文稿，还能规划行程、预定活动，甚至在内部测试中展现出处理入门级投行分析师任务的能力。其创新的“链式推理架构”通过多轮内部思考和外部工具调用来完成任务，并设有用户授权和风险控制机制，以确保数据安全和避免高风险操作。该智能体在多项测试中表现优异，已向部分用户开放，未来将支持自定义工作流，有望重塑办公生态。

💡 **自主决策与多任务执行能力**：ChatGPT智能体具备自主思考、规划和执行复杂任务的能力，能够整合Operator的网页交互、Deep Research的信息搜集以及ChatGPT的对话能力，成为一个统一的智能体。它能主动选择并调用内部技能库中的工具，以完成多步骤的复杂任务，例如深入的财务研究、制作精美的幻灯片，或规划行程和预定活动。

🚀 **强大的任务处理与基准测试表现**：在内部测试中，ChatGPT智能体已能处理入门级投资银行分析师的任务，如构建符合准则的财务报表模型或杠杆收购模型。在“人类最后的考试”中，其单次尝试通过率达到41.6%，远超以往模型；在BrowseComp基准测试中，以68.9%的成绩创下SOTA（State-of-the-Art）记录，显示出其卓越的互联网信息处理和任务执行能力。

🔗 **创新的技术架构与工具集成**：该智能体采用了“链式推理架构”，通过多轮内部思考、规划执行路径、调用浏览器和代码编辑器等外部工具，并进行结果验证和策略调整，实现高效任务完成。同时，它集成了可视化浏览器、文本浏览器和直接API访问权限等多种网络工具，增强了其处理信息和执行任务的灵活性。

🛡️ **严格的安全保障与用户授权**：为确保数据安全和用户隐私，ChatGPT智能体在执行敏感操作（如发送邮件、购买商品、提交个人数据）时会明确征求用户授权。此外，它还具备主动监督和风险缓解功能，能够主动拒绝高风险任务，例如金融交易或敏感法律互动，以避免潜在的损失和错误。

🔮 **未来展望与生态重塑**：目前，ChatGPT智能体已向Pro、Plus和Team用户开放，并计划在未来几周内向更多用户推广，同时将整合更多功能，如支持自定义工作流，允许企业接入内部系统。这预示着AI将能够直接操作公司的ERP、CRM等系统，自动处理各类业务，从而可能彻底重新定义整个办公生态。

具备自主决策能力的ChatGPT智能体正式发布！无缝融合思考、操作、进化三大AI引擎。

今天凌晨，OpenAI 临时直播，奥特曼与四位研究员正式宣告 ChatGPT Agent 上线——一个能自主思考、规划并执行复杂任务的AI智能体。

奥特曼更是直言「这让我真切感受到AGI的存在」。据介绍，ChatGPT Agent 融合了Operator智能体网页交互能力、Deep Research 的互联网信息搜集能力，以及 ChatGPT的对话能力，成为了一个统一智能体。

它具备自主思考和行动的能力，能够主动从Operator、Deep Research 和 ChatGPT的技能库中选择合适的工具，来完成各种超复杂任务。这意味着ChatGPT 不再只是那个大家熟悉的问答机器人，还能通过 “内置计算机” 代表用户完成复杂的多步骤任务。

OpenAI 介绍称，ChatGPT 智能体能够通过互联网搜索或 API 获取数据，进行深入的财务研究、制作精美的幻灯片，或者预定活动、规划行程。

在内部基准测试中，ChatGPT 智能体展现出能够处理入门级投资银行分析师（1 - 3 年工作经验）任务的能力，比如为财富 500 强公司构建符合准则的财务报表模型，或为私有化交易构建杠杆收购模型。

在演示中，OpenAI 给出了有趣的案例。根据结婚请柬上的日期、地点和着装要求，ChatGPT 智能体根据提示词，通过自主浏览、显示思维链并执行任务，圆满地完成了工作，列出了所有推荐的男装、鞋子商品，并附上推荐理由和链接。

在另一个案例中，它被要求根据美国职业棒球大联盟赛程，规划一条在2025 赛季常规赛期间，走遍全美 30 座大联盟棒球队的观赛路线，推荐酒店住宿，最后以电子表格的形式呈现并生成一张可视化路线图，它也出色地完成了任务。

用户甚至可以要求它分析三个竞争对手并制作幻灯片演示文稿，只需要一个提示，ChatGPT 智能体就会帮你完成所有工作，你只需等待结果就好。

技术实现层面，OpenAI 采用了创新的"链式推理架构"。不同于常规模型的单次响应，智能体在接收指令后会启动多轮内部思考：首先解析任务目标，然后规划执行路径，接着调用浏览器、代码编辑器等外部工具，最后验证结果并调整策略。

此外，还配备了多种网络工具，包括可视化浏览器、文本浏览器和直接API 访问权限。

对于大家关心的数据安全问题，OpenAI 表示，ChatGPT 智能体在执行敏感或重要操作（例如发送邮件、购买商品、提交个人数据）时，会明确征求用户授权。

当用户在使用ChatGPT 智能体访问金融网站时，将不能离开当前标签页，否则工具会停止运作。而对于让ChatGPT 智能体炒股这类操作暂时受到限制，主要考量是避免 AI 出错导致高额损失。

在安全性方面，它具备主动监督和风险缓解功能，能够主动拒绝高风险任务，例如金融交易或敏感法律互动。

根据OpenAI 公布的测试数据，ChatGPT 智能体在 “人类最后的考试” 中，单次尝试通过率达 41.6%，远超此前 OpenAI o3 模型的 20.3% 和 Deep Research 的 26.6%。

在 BrowseComp基准中，它以 68.9% 的成绩创 SOTA，比 Deep Research 高17.4%。

同时，在 WebArena⁠ 基准测试中，相较于由 o3 驱动的 CUA，ChatGPT 智能体表现更佳。

目前该功能已向 Pro、Plus 和 Team 用户开放，OpenAI 表示将在未来几周内向更多用户开放，并整合更多功能。据内部路线图，未来智能体将支持自定义工作流，允许企业接入内部系统。

想象一下，当AI能直接操作公司的 ERP、CRM 系统，自动处理财务报销、客户跟进等事务，或许整个办公生态都将被重新定义。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签