36kr-科技 05月17日 09:17
刚刚,OpenAI最强编程智能体上线ChatGPT
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI在ChatGPT中引入了Codex,一个云端软件工程智能体,用于并行处理编写功能、解答代码库问题、修复bug等任务。Codex基于codex-1模型,针对软件工程优化,通过强化学习训练,生成的代码更符合人类风格。目前,ChatGPT Pro、Team和Enterprise用户已可使用,Plus和Edu用户也将很快上线。Codex在安全隔离的云端环境中运行,提供清晰的patch和可验证的证据链。未来,OpenAI计划推出更具交互性和灵活性的智能体工作流,或将简化编程。

🤖 Codex是一个云端软件工程智能体,可以在ChatGPT中运行,主要用于处理软件开发任务,例如编写功能、修复bug和解答代码库相关问题。

⚙️ Codex基于codex-1模型,该模型专门针对软件工程进行了优化,通过强化学习训练,生成的代码更符合人类的风格和偏好,精确遵循指令。

💡 Codex在安全隔离的云端环境中运行,具备读写文件的能力,并可运行包括测试框架、代码检查器和类型检查器在内的各类命令,任务完成后,会将修改提交至专属环境。

💰 目前,Codex对ChatGPT Pro、Enterprise和Team用户免费开放,未来将推出限速访问和灵活的按需付费选项。

                     <p><span>从编程开始,今年智能体要卷飞了!!!</span></p>      </section>     </section>    </section>   </section>  </section>  <p><span leaf="">昨天,OpenAI CEO 奥特曼预告了一项新研究,吊足了所有人的胃口。</span></span></p>  <p><span leaf=""><img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_ea9f6b94491144689f539d1dee949591@000000_oswg28838oswg664oswg145_img_000?x-oss-process=image/format,jpg/interlace,1" /></span></p>  <p><span leaf="">就在刚刚,谜底揭晓!OpenAI 宣布,</span>在 ChatGPT 中引入了 Codex 的研究预览版。</span></span></p>  <p><span leaf="">Codex 是一个云端软件工程智能体,可以并行处理多项任务</span>,包括编写功能、解答代码库相关问题、修复 bug 以及提交拉取请求以供审核等。并且,每个任务都在其专属的云沙盒环境中运行,并预加载代码库。</span></span></p>  <p><span leaf=""><img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_0e664d2e89ae4b73b5daf26052916b7b@000000_oswg180283oswg660oswg484_img_000?x-oss-process=image/format,jpg/interlace,1" /></span></p>  <p><span leaf="">Codex 背后的模型是 codex-1,它是 OpenAI o3 的一个版本,专门针对软件工程进行了优化。</span>它使用强化学习在各种环境中针对真实编程任务进行训练,生成的代码能够高度反映人类的风格和 PR 偏好,精确遵循指令,并可以迭代运行测试,直到获得合格结果。</span></span></p>  <p><span leaf="">自今天开始,ChatGPT Pro、Team 和 Enterprise 用户即可使用 Codex,Plus 和 Edu 用户也很快可以上线使用。</span></span></p>  <p><span leaf=""><img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_74c2c99b120b434790882d6a0d131cf7@000000_oswg378844oswg1080oswg608_img_000?x-oss-process=image/format,jpg/interlace,1" /></span></p>  <p><span leaf="">对于 OpenAI 的新智能体产品,大家的反应似乎非常兴奋。有人表示自己被震撼到了,迫不及待想要体验一番。十年前学习编程时,绝对想不到这会成为可能。</span></span></p>  <p><span leaf=""><img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_6ec4bc0564af4d19b0e247dd19fd487c@000000_oswg19668oswg657oswg127_img_000?x-oss-process=image/format,jpg/interlace,1" /></span></p>  <p><span leaf="">也有人认为,Codex 这个云原生的智能体实际上可以自行构建、修复并交付功能,感觉就像软件开始了大规模自我编写。</span></span></p>  <p><span leaf=""><img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_193ee628866445d0b644b995ea3b86f5@000000_oswg19822oswg662oswg111_img_000?x-oss-process=image/format,jpg/interlace,1" /></span></p>  <p><span leaf="">还有人现身说法,在经过对 Codex 大量测试后发现,当它正常运作时,几乎更擅长「模拟」代码正在做什么以及看起来是什么样子。</span></span></p>  <p><span leaf=""><img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_73b24a8440544a82b92d8a5a95052862@000000_oswg26929oswg661oswg195_img_000?x-oss-process=image/format,jpg/interlace,1" /></span></p>  <p><span leaf="">接下来,我们先看一下官方示例,Codex 可以并行处理多项任务:</span></span></p>  <p><span leaf=""><img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_3727e499fcfe419eaeae0c552b1cd5c6@000000_oswg103783oswg785oswg441_img_000?x-oss-process=image/format,jpg/interlace,1" /></span></p>  <p><span leaf="">比如要求 Codex「找出尽可能多的 topos 和语法错误并进行修复」,它会检查代码库的可维护性和 bugs:</span></span></p>  <section nodeleaf="">   <img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_e18353a25a404f099e12fc99742eed67@000000_img_000?x-oss-process=image/format,jpg/interlace,1" />  </section>  <p><span leaf="">修复文件名中含有特殊字符的 /diff 错误:</span></span></p>  <section nodeleaf="">   <img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_ed46ab681ad04ae6a028dfef8c358d1f@000000_img_000?x-oss-process=image/format,jpg/interlace,1" />  </section>  <p><span leaf="">创建并使用 DEFAULT_ALCATRAZ_TIMEOUT 常量:</span></span></p>  <section nodeleaf="">   <img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_d9d98804f87a4855800a71fc56325000@000000_img_000?x-oss-process=image/format,jpg/interlace,1" />  </section>  <p><span leaf="">Codex 工作原理</span></span></p>  <p><span leaf="">从今天开始,用户可以通过 ChatGPT 侧边栏访问 Codex,输入 prompt 并点击 "编写代码" 按钮即可执行新的编程任务。</span></span></p>  <p><span leaf="">若需针对代码库提问,可点击 "Ask"。每项任务均在独立隔离的环境中处理,该环境已预加载用户的代码库。Codex 具备读写文件的能力,并可运行包括测试框架、代码检查器和类型检查器在内的各类命令。任务完成时间通常为 1 至 30 分钟(视复杂度而定),用户可实时查看 Codex 的处理进度。</span></span></p>  <p><span leaf="">任务完成后,Codex 会将其修改提交至专属环境。通过终端日志引用和测试输出记录,Codex 为所有操作提供可验证的证据链,便于用户追溯任务执行全过程。用户还可审阅结果、要求进一步修改、创建 GitHub 拉取请求或直接将变更集成至本地环境。在产品中,用户可将 Codex 环境配置为无限接近实际开发环境。</span></span></p>  <section nodeleaf="">   <img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_c13830c662d746f28a802a5a4a320fef@000000_img_000?x-oss-process=image/format,jpg/interlace,1" />  </section>  <p><span leaf="">Codex 可遵循代码库中的 AGENTS.md 文件执行操作。这类文本文件(类似 README.md)用于指导 Codex 如何浏览代码库、运行哪些测试命令,以及如何遵循项目标准规范。与人类开发者类似,当获得配置好的开发环境、可靠的测试方案和清晰的文档时,Codex 智能体能发挥最佳效能。</span></span></p>  <p><span leaf="">在编码评估和内部基准测试中,即便没有 AGENTS.md 文件或定制脚手架,codex-1 也展现出强劲性能。</span></span></p>  <p><span leaf=""><img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_8565b51de7344abc9e61473f55ebf9ec@000000_oswg66624oswg1080oswg443_img_000?x-oss-process=image/format,jpg/interlace,1" /></span></p>  <p><span leaf="">构建安全可靠的智能体</span></span></p>  <p><span leaf="">在设计 Codex 时,OpenAI 优先考虑安全性和透明度,以便用户能够验证其输出。用户可以通过引用、终端日志和测试结果来检查 Codex 的工作。</span></span></p>  <p><span leaf=""><img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_7eba026557934afa9e2a235902ff6ca5@000000_oswg344020oswg1080oswg608_img_000?x-oss-process=image/format,jpg/interlace,1" /></span></p>  <p><span leaf=""><img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_ecc621253b9e4e1b872a8ce90ab7c1ec@000000_oswg284537oswg1080oswg608_img_000?x-oss-process=image/format,jpg/interlace,1" /></span></p>  <p><span leaf="">与 o3 相比,codex-1 始终能够生成更清晰的 patch,以便立即进行人工审核并集成到标准工作流程中。</span></span></p>  <p><span leaf=""><img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_4f50001f9fbb4f10b3c53855efaa7788@000000_oswg90692oswg1080oswg1604_img_000?x-oss-process=image/format,jpg/interlace,1" /></span></p>  <p><span leaf="">Codex 与 o3 对比:</span></span></p>  <section nodeleaf="">   <img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_f3912ce01a224dfe826c856ef99b5dca@000000_img_000?x-oss-process=image/format,jpg/interlace,1" />  </section>  <section nodeleaf="">   <img width="100%" height="auto" src="https://img.36krcdn.com/hsossms/20250517/v2_8a4ca020434f4881877d3663fde9a42f@000000_img_000?x-oss-process=image/format,jpg/interlace,1" />  </section>  <p><span leaf="">OpenAI 表示,Codex 智能体完全运行于云端的安全隔离容器中。任务执行期间将禁用互联网访问,确保智能体仅能交互以下内容:通过 GitHub 仓库明确提供的代码、用户通过设置脚本配置的预安装依赖项以及该智能体无法访问任何外部网站、API 或其他服务。</span></span></p>  <p><span leaf="">Codex 定价如何?</span></span></p>  <p><span leaf="">Codex 用起来贵不贵?</span></span></p>  <p><span leaf="">OpenAI 表,从今天开始,将向全球范围内的 ChatGPT Pro、Enterprise 和 Team 用户开放 Codex。在接下来的几周内,用户可以免费畅享 Codex,探索它的各项功能。此后,他们将推出限速访问和灵活的按需付费选项,供用户购买额外使用量。</span></span></p>  <p><span leaf="">对于使用 codex-mini-latest 进行开发的用户,该模型可通过 Responses API 调用,定价为:</span></span></p>  <ul class=" list-paddingleft-2">   <p><span leaf="">输入 tokens:每 100 万 $1.50</span></span></p>   <p><span leaf="">输出 tokens:每 100 万 $6</span></span></p>  </ul>  <p><span leaf="">此外,OpenAI 表示,Codex 仍处于早期开发阶段。作为研究预览版,它目前尚不具备某些功能,例如:前端工作所需的图像输入支持,在 Codex 运行过程中实时调整智能体的能力。</span></span></p>  <p><span leaf="">此外,远程智能体的执行速度比交互式编辑慢,这可能需要一定的适应时间。不过,随着时间推移,与 Codex </span></span><span leaf="" data-pm-slice='1 1 ["para",{"tagName":"p","attributes":{"style":"text-align: justify;line-height: 1.75em;margin-left: 8px;margin-right: 8px;"},"namespaceURI":"http://www.w3.org/1999/xhtml"}]'>智能体的协作将越来越像与同事的异步协作。</span></span></p>  <p><span leaf="">最后 OpenAI 表示,未来计划推出更具交互性和灵活性的智能体工作流。</span></span></p>  <p><span leaf="">未来,编程也许真会变的越来越简单。</span></span></p>  <p><span leaf="">参考链接:<a href="https://openai.com/index/introducing-codex/" _src="https://openai.com/index/introducing-codex/" rel="noopener noreferrer nofollow">https://openai.com/index/introducing-codex/</a></span></span></p>  <p><span leaf=""> </span></span><span>本文来自微信公众号</span><a href="https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&amp;mid=2650969451&amp;idx=1&amp;sn=adb07a6587841af3f07af1301dedee94&amp;chksm=85104ca18e0be39f11d69a5cc6071b64493e77d573240758283a41178e2a77e2eb385068d556&amp;scene=0&amp;xtrack=1#rd" rel="noopener noreferrer nofollow">“机器之心”(ID:almosthuman2014)</a><span>,作者:关注AI的,36氪经授权发布。</span></p>

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI Codex 编程智能体 软件开发
相关文章