新智元报道
新智元报道
agent还能借助ChatGPT连接器,连接Gmail、Github等应用,便于根据提示找到相关信息并给出回复。不仅如此,接管浏览器后登录任何网站,让ChatGPT agent进行更深入、更广泛的研究和任务执行。由此,ChatGPT便能选择最佳路径,高效地执行任务。
为了展示ChatGPT agent能力,团队现场演示了一个真实场景:为朋友Minnie和Sarah策划一场婚礼。根据提示,这项任务需要AI依据着装要求和天气情况,推荐精美价格合理的礼服、为参会者预订酒店,以及为新人准备婚礼礼物。ChatGPT agent在理解提示后,并没有直出报告,而是再次重述确认任务要求,比如确切的婚礼日期。当一切确认之后,接下来,它便自主打开浏览器,并在交互页面上显示逐步执行的每一个过程,即思维链。需要注意的是,agent会在几秒内配置好的虚拟计算环境中,开始执行任务。任务执行中,agent使用文本浏览器查询,并找到了合适的西装,然后切换到视觉浏览器,等待确认。在ChatGPT执行婚礼策划任务同时,还可以让它做另一个任务:购买一双9.5码黑色鞋子。也就意味着,ChatGPT agent不惧被打断。即便上一个任务规划时间很长,也不耽误接下来的事情。最后,ChatGPT agent生成了一份非常全面的报告,包括礼服、酒店、鞋子、礼物全部给出了规划和建议。在另一个演示中,团队用ChatGPT应用开启任务——上传一张团队吉祥物——可爱小狗的图片,做成笔记本贴纸,并订购500个。然后,它便开始调用工具Imagen生成动漫版图片,并设计贴纸,从StickerMule订购500份寄到xxx。更令人惊喜的是,ChatGPT agent还能通过连接器,比如Google Drive提取评估数据,自己生成PPT。在此过程中,agent会编写代码,并将其编译成最终幻灯片。它还会借用图像工具,为PPT页面进行装饰。不一会功夫,它就直接输出了第一张HLE、FrontierMath的PPT,但不够精致,然后它再次通过RL不断优化。最终,就得到了一个优美的PPT文件,可以在办公软件中直接打开。不得不说,ChatGPT agent太强了。甚至,你还可以让ChatGPT agent制定一个参观30+美国职棒大联盟球场的最佳行程。耗时25分钟,它迅速生成一个直观可视化的Excel,以后做数据也彻底解放了双手。
2. 代码杠杆:当前的AI智能体是纯软件形式,可以轻松复制。如果你想要10倍的产出,就运行10个智能体;想要12倍,就再加两个。这种杠杆不需要许可,可以随意扩展。
在这场发布会上,OpenAI重提了「AI杠杆」这一核心话题。他们同样认为,2025年之后,AI智能体将成为一种全新的杠杆机制。它不仅能代替人类完成工作,还能通过「复制粘贴」无限扩展。不论是10个,还是更多智能体,不需要额外的许可,即可一键部署。研究人员举例称,Deep Research发布之后近半年里,极大地提升了个体和小团队的产出。过去,团队规模化需要依赖「人力杠杆」,但人类协作的沟通成本,甚至包括摩擦,往往成为了瓶颈。而现在,ChatGPT agent的出现一个重大意义在于,让小团队创造巨大的价值。
这种「超级个体」模式,或许在未来将重塑企业的组织架构,凭借AI实现指数级增长。
文章原文