01.开发者视角下的 Claude CodePart 1: 为什么 Claude Code 会成为 Anthropic 的 Killer App分享人:• 黄航:InsForge 创始人,创业前在 Amazon 担任 Senior PM• Tony:InsForge 联合创始人,创业前在 Databricks 工作1. 为什么开发者迁移到了 Claude Code1)成本低:Claude Code 极大降低了用户使用最先进的 model 的成本,非常适合每天都写代码的高频开发者。目前 Opus 是交付能力最好的模型,但在 Cursor 的产品设计中,默认提供的是 Sonnet 模型,用户如果要使用 Opus 模型就需要按使用量单独计费。和 Sonnet 比,Opus 非常昂贵,消耗的 token 量为 Sonnet 的 5 倍,费用大约为每小时 20–40 美元。对于高频开发者来说,在 Cursor 目前的产品设计下,如果要持续使用 Opus 模型,月支出往往会达到 4000-5000 美元。作为对比,Claude Code 可以直接选择 Opus 模型,几乎可以无限使用 token,月固定费用为 200 美元,成本可以降低至之前的 1/20,显著低于 Cursor。即便不使用 Opus 模型,只采用 Sonnet 模型,在 Cursor 按使用计费的情况下,开发者每月需要花费约 400–500 美元。同等开发量和 token 使用量在 Claude Code 上通常只需每月 100–200 美元,成本至少可以降低 1/2,且在交付效率和响应质量方面,Claude Code 也明显优于 Cursor。Cursor 官网定价2)效率高:端到端建立项目的成功率和效率都极高Cursor 没有自主拆解任务的能力,所以需要开发者在使用 Cursor 的时候就要有对于如何构建这个 project 的具体想法。相比之下,Claude Code 具有 planning 能力,用户只需要在 prompt 中给出大致需求后,Claude Code 就可以自主地将任务拆分为子任务,逐步完成且实时反馈。而且 Claude Code 在读已有的很大的 codebase 的时候,还会自主创建一个 context 文件并学习 context,能够在开发过程中生成 test command,进行自主地调试,出了问题会自己 debug 等。比如,就有开发者提到,提高 vibe coding 成功率的关键就是要有测试依据。除了单元测试(时间成本与维护成本都较高)之外,基于 language server 及时编译(比如 tsc)的检查更有价值,Cursor、Windsurf 在今年都陆续支持了这个功能。此外,Claude Code 的出色能力,不仅受益于大模型本身智商的提高,工程也很关键,Windsurf、Cursor 早期经常出现编译错误,但 Claude Code 几乎就没这个问题。3)异步 async 开发和高代理(L4):Claude Code 对于超长文本有记忆管理能力,是真正的 agentic 模式,大幅减少了需要人介入的部分。由于 Cursor 有 context window 限制,在长 context 的场景下会遗忘最开始的 prompt 和需求,因此需要开发者辅助定义 workflow 和进行 debug。而 Claude Code 有 memory context 的功能,可以在即将遗忘 context 的情况下自主地回顾、压缩先前的 prompt,形成 memory。2. 虽然 CLI 很火,但 GUI 才是未来今天我们看到的 Claude Code 的产品形态其实是内部工具直接开发给外界用户的产品,并不是 Anthropic 为了专攻 coding 领域而专门规划、打造出来的产品。Anthropic 的 CPO 就专门讲过这件事,Anthropic 团队内部已经有 90% 的代码都由 Claude Code 生成了,后来,公司觉得这个工具有潜力对外试水,于是在几乎没有进行任何产品优化的情况下,就发布了。在编程领域,开发者更关注工具的最终效果,因为 Claude Code 所使用的底层模型 Opus 能力非常强大,所以即使没有进行产品化设计、即便 CLI 很难用,大家也愿意使用。因此 Claude Code 爆火更多证明了 Opus 模型能力很强,并不能验证 CLI 这个形态是 coding agent 的终局。最近 CLI 之所以讨论度很高,还因为 Google 在看到 Claude Code 的成功和市场需求后,为了快速入局并抢占市场份额,选择直接推出免费且量大的 Gemini CLI,迅速吸引了价格敏感、对产品忠诚度不高的 coding agent 开发者,进一步推高了 CLI 的声量和热度。但如果站在用户体验角度看 CLI,其实 CLI 的局限相当明显:1)AI 是直接生成代码的,一旦出现幻觉或错误,用户不能修改与撤销,只能依赖 Git 等外部工具进行版本回滚,操作非常繁琐;2) 在安装插件、配置内存或指定任务等高级操作上,用户需要手动编写和修改配置文件,对普通用户而言,使用门槛很高;3)处理图片等多媒体文件非常不便,用户无法像在 GUI 中那样通过拖拽来实现图片上传、实时展示等功能,多模态交互体验很差。因此,coding 工具只有通过 GUI 来优化体验,才能被更广泛的用户群体所接受。Claude Code 也已经开始推出 UI 界面和 VSCode 扩展。此外,未来的产品形态将会是 GUI,但不一定是 IDE。因为 IDE 是过去数十年软件开发模式下的产物,它本身也存在一定的学习曲线和历史包袱。AI-native 开发工具可能会带来全新且更高效的交互模式。3. Cursor or Claude Code?如果综合 coding 领域所有 use case,结合用户使用偏好和工具交付效果来看,Cursor 还是优于 Claude 的。这是因为 Cursor 对用户体验做了很多优化,而且 Cursor 在处理简单任务时的速度非常快。此外,Cursor 的市场认可度和渗透率也是最高的,满足了大企业对 SLA(服务稳定性)、数据隐私和安全性的严格要求,比如 Tony 就提到 Databricks 目前就与 Cursor 谈合作,内部数千名员工都可以使用 Cursor。此外,黄航还提到 Amazon 也正在与 Cursor 进行合作谈判。但 Cursor 和 Claude Code 并不是简单的取代关系,目前来看,二者会在不同的应用场景中展现出各自的优势:• 对于修改按钮样式这类需要快速提供 context 的简单场景,Cursor 的运行速度更快;• 对于需要理解数万个文件构成的大型代码库,或需要完成端到端的复杂任务的时候,Claude Code 会更加合适。比如在企业日常开发环境中,Cursor 这类 Agent+IDE 的模式因为可以融合现有的工作流,更加用户友好,企业忠诚度也会更高,而在自动化场景中,Claude Code 这样的 CLI 工具更具优势。4. 现在的 Coding Agent 还缺什么?1)语音输入通过键盘输入冗长、结构化的文字指令,对普通人来说费时且困难。人类更擅长说话来描述复杂需求,而这恰好是 LLM 最擅长的。未来 coding agent 或许可以将语音作为主要的交互方式,用户只需要通过说话下达命令,AI 就可以理解并执行。现在已经有开发者在 coding 时会使用转录工具,将语音直接转为指令,这很大程度上提升了开发的效率。也有开发者认为,目前的语音输入技术能满足转录需求,但长期来看,考虑到 coding 任务的复杂性,效率较高的交互方式或许并不是单纯依靠语音输入,而是可以实现定向修改,类似在使用 PS 工具的时候,选中某一区域让 AI 针对性修改。2)GUI 编排异步编程GUI 编排异步编程也是一个值得发展的方向,比如,用户可以在一个画布上同时让多个 Claude Code 分别执行不同任务,并可以对任务进行终止或回退,在这种工作流下,用户扮演的是项目管理者的角色,这将大幅提升开发效率和灵活性。5. Demo 互动:搭建一个互动提问网页在分享过程中,黄航也演示了如何用 AI coding 工具搭建一个实时互动的 Q&A 网站,并对 Lovable 和 Claude Code 的效果进行了对比。需要指出的是,Windows 系统下的用户需要先安装并切换到 Linux 命令行环境才能进行 Claude Code 操作,没有做原生集成这一点也是影响 Claude Code 市场渗透率的因素之一。网站设计的 prompt 如下:
帮我开发一个观众 QA 产品:
观众可以登录然后 Post 自己的问题
每个 Post 的问题可以被点赞,问的 list 按照赞数从高到低排列,每个用户对每个问题只能点赞一次,也可以取消点赞
合适的剧新机制,让现众能看到重新排列的 list
赞数排列和交替位置的特效要比较 cool,除了数字以外,模向能有 bar 来展现赞数的多少效果
Lovable VS Claude Code从效果来看,Lovable 和 Claude Code 生成的网页在前端上没有显著差别,但是在后端上,Lovable 使用 Supabase 进行后端数据库的连接,但在上传问题时,Lovable 会显示报错,也就是说 Lovable 并没有成功连接数据库。而 Claude Code 通过 MCP 连接到黄航自己的产品 InsForge,交付的网页可以成功使用。