刚刚，OpenAI开源了两个Agent项目，手搓Manus时代来袭~

PaperAgent 03月12日

刚刚，OpenAI开源了两个Agent项目，手搓Manus时代来袭~

OpenAI推出Agent开发套件，旨在帮助开发者构建可靠且强大的AI Agents。该套件包含内置工具，如网页搜索、文件搜索和电脑使用功能，以及新的Responses API，结合了Chat Completions API的简洁性与Assistants API的工具使用功能。此外，还提供了开源的Agents SDK，用于构建多智能体工作流，以及Computer Using Agent项目，展示如何使用OpenAI API构建能够模拟人类操作的智能体。这些工具共同构成了一个完整的Agent开发生态系统，为开发者提供了强大的支持。

🧰 OpenAI发布Agent开发套件，核心在于提供内置工具，包括网页搜索、文件搜索和电脑使用（Computer Use）功能，旨在简化Agent的开发流程。

🔄 Responses API的推出，融合了Chat Completions API的简洁性和Assistants API的工具使用功能，为构建Agents提供了更灵活的选择。

💻 开源的Agents SDK是一个轻量级但功能强大的框架，用于构建多智能体工作流，其核心概念包括Agent（智能体）、Handoffs（交接）、Guardrails（防护栏）和Tracing（追踪）。

🖱️ Computer Using Agent项目展示了如何使用OpenAI API构建能够模拟人类操作的智能体，通过连续循环发送计算机操作指令，实现自动化任务，如预订航班、搜索产品或填写表格。

2025-03-12 10:59 湖北

OpenAI举行了一场面向开发者的直播，推出Agent开发套件，帮助开发人员构建可靠且强大的 AI Agents：

内置工具（Built-in tools）：包括网页搜索、文件搜索以及电脑使用（Computer Use）

Responses API ：新的响应API，将 Chat Completions API 的简单性与 Assistants API 的工具使用功能相结合，用于构建Agents

Agents SDK：协调Single-Agent和Multi-Agent工作流程

监控工具：集成可观察性工具跟踪和检查Agent工作流程的执行情况

其中：Agents SDK是开源的，并且还开源了一个Computer Using Agent项目

1、Agents SDK项目

OpenAI Agents SDK 是一个轻量级但功能强大的框架，用于构建多智能体工作流。

核心概念：

Agent（智能体）：经过指令配置的大型语言模型（LLMs），配备工具、防护栏和交接功能。

Handoffs（交接）：允许智能体将特定任务的控制权移交给其他智能体。

Guardrails（防护栏）：可配置的安全检查，用于输入和输出验证。

Tracing（追踪）：内置的智能体运行跟踪功能，允许你查看、调试和优化你的工作流。

2、Computer Using Agent 项目

OpenAI提供了一个使用 OpenAI API构建计算机使用Agent（CUA：Computer Using Agent）的示例应用程序：

计算机使用工具以连续循环的方式运行。它发送计算机操作（例如click(x,y)或type(text)），代码会在计算机或浏览器环境中执行这些操作，然后将结果的屏幕截图返回给模型。

通过这种方式，代码可以使用计算机界面模拟人类的动作，而模型则可以利用屏幕截图来了解环境的状态并提出下一步的动作。

通过此循环，可以自动执行许多需要点击、输入、滚动等操作的任务。例如，预订航班、搜索产品或填写表格。

Agents Blog: https://openai.com/index/new-tools-for-building-agentsBuilt-in tools: https://platform.openai.com/docs/guides/tools?api-mode=responsesResponses API: https://platform.openai.com/docs/api-reference/responsesAgents SDK项目：https://github.com/openai/openai-agents-pythonComputer Using Agent项目：https://github.com/openai/openai-cua-sample-app

推荐阅读

• 动手设计AI Agents：Coze版（编排、记忆、插件、workflow、协作）

• DeepSeek R1 + Agent 的下半场

• RAG全景图：从RAG启蒙到高级RAG之36技，再到终章Agentic RAG！

• Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解（1.2万字，20+文献，27张图）

欢迎关注我的公众号“PaperAgent”，每天一篇大模型（LLM）文章来锻炼我们的思维，简单的例子，不简单的方法，提升自己。

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI Agent开发 Agents SDK Computer Using Agent

相关文章

OpenAI加入C2PA指導委員會，測試Deepfake圖像偵測工具

How popular is ChatGPT? Part 1: more popular than Taylor Swift

OpenAI set to unveil AI-driven challenger to Google Search

OpenAI faces complaint over fictional outputs

OpenAI计划下周宣布ChatGPT和GPT-4更新，但不会推出GPT-5和搜索引擎

苹果据悉接近与OpenAI达成协议，将ChatGPT应用于iPhone

OpenAI据悉正开发AI语音助手

Comment on What should the UK’s £100 million Foundation Model Taskforce do? by Government-issued digital money gets closer - The World News Papers

Comment on What should the UK’s £100 million Foundation Model Taskforce do? by Il denaro digitale emesso dal governo si sta avvicinando - Darios Cafe Blogs

Codex, OpenAI’s Automated Code Generation API with Greg Brockman - #509