赛博禅心 前天 11:18
Codex 实测:OpenAI 的云端 Coding Agent
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI 推出的新功能 Codex,是一个云端代码助手,由 codex-1 模型、云端沙盒和 GitHub 接口组成。尽管产品交互设计出色,但目前功能受限,无法联网或安装依赖,主要用于代码缝补和修改。在Verilog代码编写方面表现尚可。Codex 提供了安全的云端沙盒环境和 GitHub 集成,但其功能仍处于 Research Preview 阶段,实际应用场景有限,需谨慎期待。

💡Codex 基于 codex-1 模型,经过强化学习微调,在代码生成方面有所提升,风格更贴近人类代码,提高了准确性。

💻Codex 采用云端沙盒环境,为每个任务启动独立的服务器,预先拉取 GitHub 仓库代码,运行配置的构建脚本、测试命令等。但沙盒环境不联网,无法安装依赖。

🔗Codex 通过 GitHub 接口连接用户仓库,获取只读或写权限,用户可选择组织和设定权限范围,并需启用 MFA。最终修改需用户手动发 PR 或下载补丁。

🚫Codex 限制较多,例如不能联网访问外部 API 和网站,也不能临时安装依赖包,只能在已有代码和配置好的环境上进行修改。

⚠️虽然产品设计出色,流程清晰,但 Codex 仍处于 Research Preview 阶段,功能有限,目前主要用于代码缝补,不宜有过高期望。

原创 金色传说大聪明 2025-05-17 21:41 广东

产品交互很不错,但目前不要太高期待

 

昨晚,OpenAI 上了个新功能:Codex,云端的 Coding Agent

Codex 简要概述这东西,由 3 部分组成:codex-1 模型、云端沙盒、GitHub 接口封装

不错的产品,交互很赞但不能自主装依赖,目前干不了活

这个 Agent 的功能大概包含:

    • 问答 Git 上的项目

    • 跑现成的代码

    • 修代码,提 PR(修改代码,然后提交上去)

按 OpenAI 员工的说法,他们部分时候也会拿这个处理代码

总评:非常没用

用例实测

我必须再次说:这东西目前限制很多,包括不仅限于:

    • ❌ 不能联网(不能访问外部 API、网站)

    • ❌ 不能临时装依赖(如 pip install 无效)

    • ✅ 只能用你仓库里已有的代码 + 你事先配置好的环境

所以这东西,只能做缝补,几乎干不了重活

我能想到的几个典型场景:

    • QA 大佬们的代码

    • 写一点不需要配环境的代码

QA DeepEP

DeepEP 是之前 DeepSeek 开源的 Infra 框架,我先把它丢进去,选择「询问」就好了

写 Verilog

我本职专业,是EE。

Verlog 这东西,和常规环境没啥关系,但非常依赖 AI 对整体项目的理解,而且完全不能依赖 Rag 代码。

效果是不错的,改改能用(毕竟 o3)。


背后的实现

说真的,这东西的实现并不复杂,相信很快就会有一堆类似的。

分为三块:模型、云端沙盒、打通 GitHub,分别来说说

模型

Codex 背后的模型是 codex-1,通过 o3 调出来的,让风格更贴近「人写的代码」,并且准确性也提升了一些。

以及,发了一个同源的模型:codex-mini-latest,输入 $1.5,输出 $6 每百万 token,比 o4-mini 贵了 30%左右。

在代码场景下,效果比 o3 更好一点

调的方法,叫做 Reinforcement Learning, 强化微调,之前介绍过:👉 OpenAI 新货详解:强化微调

云端沙盒

Codex 的代码是跑在云端的,会为每个任务启动一个独立的云端沙盒环境,这环境里:

    • 预先拉好你选的 GitHub 仓库(只读)

    • 跑你配置好的构建脚本、测试命令、lint 等

    • 不联网,也没办法 pip install

大致就是“开了一台干净的服务器”,只装你确认过的东西,它再在里面开始「干活」。

在代码场景下,效果比 o3 更好一点

注意:所有修改都只在这个沙盒里完成,Codex 不能直接动你线上仓库的代码,最终得你点按钮发 PR 或下载补丁。

打通 GitHub

Codex 需要你授权 GitHub

    • 你点「Connect GitHub」之后,它会拿到你的仓库只读权限(或者写权限,如果你开了)

    • 如果你是团队账户,还要选组织、设定权限范围

    • 需要启用 MFA(多因素认证),毕竟你让 AI 有权限提 PR,可以用 Google Auth 或者任何,这里我用的 OnePass

走个流程

可以吹,别过分

老实讲...这些任务,不用 Codex 也能完成

这个东西全名叫 Codex Research Preview,单纯 Preview 已经不够了,还得加上 Research,毕竟啥活也干不了,不要有太高的期待

但是,方向是很赞的。

假想一下你干活干到一半去吃法了,AI 无缝接管了你的环境,继续完成你的工作

总结一下

Codex 是 ChatGPT 新加的远程代码助手。它:

    • 产品设计确实不错,放心也很稳

    • 云上跑,隔离安全

    • 模型靠谱(codex-1 微调自 o3)

    • 流程清晰,输出可追溯(log、diff、测试结果)

但:

    • 不能联网

    • 不能装包

    • 只能在你给定的框架里改点东西

保持关注这个东西全名叫 Codex Research Preview,单纯 Preview 已经不够了,还得加上 Research,目前不要有太高的期待

👉 chatgpt.com/codex

 

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI Codex 代码助手 GitHub
相关文章