真格基金 01月03日
Coding-Agent 进化论:三小时深度对话中美 Agent 创业者、阿里研究员和投资人|此话当真 EP34
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本期播客深入探讨了AI Coding Agent的演进历程,从最初的编程助手到能够独立完成软件开发的“AI程序员”Devin,展现了AI在编程领域的巨大潜力。嘉宾们分享了Replit Agent和OpenHands的创业故事,探讨了Coding Agent的核心能力和技术壁垒,以及对未来社会组织和工作形态的深远影响。同时,对OpenAI发布的o3模型进行了分析,认为其在编程和推理能力上的突破预示着AI新阶段的到来。此外,播客还讨论了Coding Agent的未来发展趋势以及潜在的创业机遇。

🚀Coding Agent 的发展演进:从最初的IDE编程助手Cursor,到支持多轮对话的Replit,再到能够独立完成软件开发的Devin,Coding Agent经历了多次迭代,产品形态不断进化,展现了AI在编程领域不断提升的能力。

💡Replit Agent与OpenHands的创业故事:Replit Agent在技术更新中不断迭代,强调优秀创业者的产能会被无限放大;而OpenHands则致力于用Coding推动技术民主化,这两个案例都展现了Coding Agent领域的创新与活力。

🤖o3模型的突破与局限:OpenAI的o3模型在SWE-Bench测试中取得显著进步,并在类人推理能力上首次突破人类水平阈值,但仍需进一步解决真实世界的复杂问题,并探索新的Benchmark。

🏢未来组织形态与理想工程师:Coding Agent的出现将改变未来的组织形态,对工程师的画像提出新的要求,例如如何提高模型多步骤任务的能力,以及如何与AI更好地协同工作等。

💰Coding Agent的投资机遇:播客从投资人视角探讨了Coding Agent领域的创业机遇,以及底层技术栈的新机会,为该领域的创业者和投资者提供了有价值的参考。

原创 与你同在的 2025-01-03 14:03 北京

未来,正在加速到来。

用声音,听见真格。


「此话当真」是一档泛商业类播客,我们希望搭建这样一个分享和交流的平台,让每一个对商业、科技、创投充满好奇的人都能在这里有所收获。每期播客将会由不同的真格投资人担任主持,和各领域的领军人物一起带大家深入了解科技趋势,以及创新技术的影响力。交流科技热点,我们只想给你最专业的解读。


当然,我们希望这不仅仅是一个播客,更是一次创业的探索。真格,你的创业第一站!我们期待与你相遇,一同发现新的可能。



回顾 2024 年,AI Coding 无疑是过去一年里最炙手可热的领域之一,Cursor、Poolside、Cognition、Magic、Codeium、Replit 等多家独角兽的出现,都在反复验证着这一市场需求。


从更长远的时间尺度来看,Agent 是 AI 落地人们日常生活的最小可能单位。在过去不到两个月的时间里,Coding Agent 已经完成在产品形态上的二连跳,从能够上下文预测的 IDE 编程助手 Cursor,到实现支持多轮对话的 Replit,用户得到的「交付物」已不只是基于搜索关键词的网页,而是根据自身需求生成的软件。12 月 11 日,Cognition AI 正式对公上线「AI 程序员」Devin,不仅能为用户提供建议、自动执行指令任务,更能独立完成对整个软件项目的开发,再次打开了世人对 Coding Agent 全新的想象空间。


12 月 21 日,在 OpenAI 连续 12 天发布会的最后一天,o3 模型重磅登场。在由真实世界软件任务组成的 SWE-Bench Verified 基准测试中,o3 模型获得了 71.7% 的准确率,比 o1 模型高出 20% 以上;在评估 AI 类人推理能力的 ARC-AGI 测试中,则取得了 87.5% 的分数,首次突破人类水平阈值(85%)。OpenAI 首席执行官山姆·奥特曼在发布会上表示,「我们认为这是AI下一阶段的开始。o3 能够完成许多复杂且需要深度推理的任务,尤其在编程和数学领域表现令人难以置信。」


展望 2025 年,AI 领域还有更多值得思考的问题。底层大模型突破后,AI Agent 还会以怎样的形态出现?Coding Agent 产品的核心能力与技术壁垒在哪里?未来的组织里又需要怎样的新员工?下一代的「互联网」会以怎样的形式到来?在面向未来的开放式想象中,Coding Agent 和以 RL(强化学习)为新范式的 o3 系列,都会是所有讨论里无可回避的焦点。


眼下,陈旧的想象已然无法满足技术的野心。或许能够实现 end-to-end 的 Coding Agent,能做成的事情已远不止 Coding 本身。以改变人们的工作方式为起点,Agent 是人们迈向 AGI 的最小单位,而每次迭代带来的全新范式,都在反复提醒人们这样一个事实 —— 未来,正在加速到来。



内容纲要





来自真格基金音频:Coding-Agent进化论:深度对话Agent创业者、阿里研究员和投资人



未来,正在加速到来。




主持人


谢岩 Monica:真格基金投资副总裁

联合主持人 Peak:真格基金 EIR


嘉宾


戴雨森:真格基金管理合伙人,聚美优品联合创始人

李珎:Replit Agent 核心成员,Replit 资深工程师

王星尧:Allhands Al (FIFIE OpenHands) 联合创始人,首席人工智能官,UIUC PhD

惠彬原:阿里巴巴通义实验室科学家


时间轴


Coding Agent 的发展演进

01:56 嘉宾自我介绍与最近体验到有意思的项目

13:36 Coding Agent 的四个代际与三次进化

16:53 Devin 引发的全新想象:工作的 Scaling Law


两家 Coding Agent 公司的创业故事

20:47 Replit Agent的创业历程及关键节点

25:50 「优秀创业者的产能会被无限放大。」

35:59  几次技术更新:Integration、Edit 和 UI

38:06 未来不同 Coding Agent 产品形态会复合吗?

37:30  OpenHands 不同寻常的诞生

47:48 「要用有限的空间,做无限的事情。」

52:25 开源:用 Coding 推动一种技术民主化

1:02:40 Coding 产品的长期竞争力是什么?


o3 发布:突破、局限与趋势

01:07:20 AGI 的未来已经近在眼前

01:18:10 解决真实世界的复杂问题,o3 还需做什么?

01:22:23 SWE-bench 被「刷爆」,下一个 Benchmark 是什么?


未来,如何做好一个 Coding Agent?

01:34:27 Coding Agent 重要时点回顾

01:39:23 未来的组织形态,理想工程师的画像是?

01:56:11 如何提高模型多步骤任务的能力?

02:05:54 Agent 普及后,底层技术栈的新机会

02:11:30 投资人视角下的创业机遇

02:23:27 快问快答


相关推荐

Cursor:https://www.cursor.com/

Cognition labs/Devin:https://app.devin.ai/

Replit:https://replit.com/

Replit Agent:https://docs.replit.com/replitai/agent/

OpenHands:

VisualWebArena: http://arxiv.org/

TheAgentCompany: 

Computer use by Anthropic:https://www.anthropic.com/news/3-5-models-and-computer-use/



你可以通过小宇宙、苹果 Podcast 、喜马拉雅收听我们。如果你对节目有任何的建议与期待,欢迎在留言区互动~


如果你有任何的创业想法或合作想法,欢迎发邮件到 media@zhenfund.com !




推荐阅读


跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI Agent Coding Agent 人工智能 OpenAI o3模型
相关文章