IT之家 07月18日 01:28
OpenAI 史上最强 ChatGPT 智能体发布:浏览网站、写代码、做 PPT 样样精通
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI近日宣布在ChatGPT中推出一款名为ChatGPT智能体的通用型AI助手,该智能体能够帮助用户自动完成多种计算机任务,如生成演示文稿、管理日程、在线购物以及运行代码等。它整合了OpenAI此前的Operator和Deep Research等智能体功能,用户仅需通过自然语言即可与其交互。该智能体拥有强大的工具访问能力,可连接Gmail、GitHub等应用,并能访问终端和API。在多项基准测试中,ChatGPT智能体展现出领先性能,尤其在处理复杂数学和学科知识测试时表现卓越,其底层模型在Humanity's Last Exam和FrontierMath等测试中得分显著优于以往模型。该功能将逐步向不同订阅用户开放。

🌟 ChatGPT智能体是一款强大的通用型AI助手,能够自动执行多种计算机任务,极大地提升了用户处理日常工作的效率。例如,它可以根据用户的指令生成可编辑的演示文稿和幻灯片,还能通过查看用户的日历来简要介绍即将到来的客户会议,甚至可以计划并购买制作家庭早餐所需的食材,以及运行代码等。

🚀 该智能体整合了OpenAI先前多种智能体工具的功能,特别是Operator的网站点击能力和Deep Research的跨网站信息综合能力,使得它能够更全面、更深入地处理用户的请求。用户只需使用自然语言向ChatGPT发出指令,即可与这个智能体进行交互,操作过程简单直观。

🔗 ChatGPT智能体具备强大的连接和访问能力,能够通过ChatGPT连接器访问Gmail、GitHub等第三方应用,从而获取和处理用户的个性化信息。此外,它还能访问终端并使用API来调用特定应用的功能,这意味着它能够更灵活地与外部世界互动,执行更复杂的任务。

📊 在性能方面,ChatGPT智能体的底层模型在多个基准测试中均表现出最先进的水平。例如,在Humanity's Last Exam这一涵盖广泛学科的困难测试中,其得分率达到41.6%,远超之前的模型。在FrontierMath这一极具挑战性的数学基准测试中,当智能体能够访问工具(如终端)时,其得分更是达到了27.4%,远超以往的最佳表现。

👥 OpenAI将ChatGPT智能体首先向Pro、Plus和Team计划的订阅用户推出,并计划于夏末向企业和教育用户开放。用户只需在ChatGPT的工具下拉菜单中选择“智能体模式(agent mode)”即可激活使用,体验AI带来的全新交互方式和工作效率提升。

IT之家 7 月 18 日消息,OpenAI 今日凌晨宣布将在 ChatGPT 中推出一款通用型 AI 智能体,该公司表示该智能体可以帮助用户完成各种基于计算机的任务。

OpenAI 介绍称,该智能体可以自动生成可编辑的演示文稿和幻灯片、查看用户的日历来简要介绍即将到来的客户会议、计划并购买制作家庭早餐的食材,以及运行代码等。

该工具名为 ChatGPT agent,结合了 OpenAI 之前多种智能体工具的功能,包括 Operator 点击网站的能力,以及 Deep Research 从数十个网站中综合信息生成简洁研究报告的能力。OpenAI 表示用户只需通过自然语言提示 ChatGPT 即可与该智能体进行交互。

为了开发这个新工具,OpenAI 将其背后的 Operator 和 Deep Research 团队合并为一个统一的团队。外媒 The Verge 报道称,这个新团队由产品和研究部门共 20~35 人组成。

OpenAI 今日起将向 Pro、Plus 和 Team 计划的订阅用户推出 ChatGPT 智能体,今年夏末向 ChatGPT 企业和教育用户开放。要激活该工具,用户可以在 ChatGPT 的工具下拉菜单中选择“智能体模式(agent mode)”。

OpenAI 表示 ChatGPT 智能体比其之前的任何产品都要强大得多,可以访问 ChatGPT 连接器,允许用户连接像 Gmail 和 GitHub 这样的应用,智能体可以根据用户的提示找到相关信息。此外,OpenAI 表示 ChatGPT 智能体可以访问终端,并可以使用 API 来访问某些应用。

根据 OpenAI 的说法,ChatGPT 智能体的底层模型在多个基准测试中提供了最先进的性能。ChatGPT 智能体模型在 Humanity's Last Exam(pass@1)中得分率为 41.6%,这是一项由数千个问题组成的、涵盖超过一百个学科的困难测试。这个分数大约是 OpenAI o3 和 o4-mini 得分的两倍

在已知最难的数学基准测试之一 FrontierMath 中,OpenAI 表示,当 ChatGPT 智能体可以访问工具(IT之家注:如用于代码执行的终端)时,其得分为 27.4%,之前的最佳分数来自 o4-mini(得分仅为 6.3%)。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

ChatGPT AI智能体 OpenAI 任务自动化 人工智能
相关文章