掘金 人工智能 前天 17:28
Claude 4 破解困扰人类 4 年系统 bug,30 年码龄程序员 200 小时没搞定,GPT-4.1/Gemini-2.5 也做不到
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

一位经验丰富的C++程序员分享了其使用Claude Opus 4解决困扰四年的"白鲸bug"的经历。该bug源于6万行代码重构后出现的边界条件问题,曾让包括GPT-4.1在内的多个AI模型束手无策。最终,Claude Opus 4仅用几个小时,通过30个提示词和一次重启,成功定位并解决了问题。这一案例突显了AI在编程领域的强大能力,以及Claude系列模型在代码理解和推理方面的显著提升,引发了开发者们对AI编程工具的广泛关注。

🧐一位拥有30年C++经验的程序员,在FAANG担任工程师,在一次6万行代码重构后遇到了一个难以解决的bug,该bug在特定shader的特殊使用条件下触发渲染错误,耗费了程序员约200小时的时间,但未能解决。

💡该程序员尝试了包括GPT-4.1、Gemini-2.5和Claude-3.7在内的多个AI模型,均未能找到问题的根源。最终,他尝试了Claude Opus 4,并配合Claude Code模式,成功解决了这个困扰他四年的难题。

👏Claude Opus 4通过分析重构前后的代码,明确指出了问题所在:旧架构“巧合”地支持了这种用法,而新架构未考虑到这种兼容性,导致失效。整个过程仅用了33个提示词和一次重启,展现了AI在代码理解和问题定位上的强大能力。

🚀Claude Opus 4是Anthropic公司推出的旗舰模型,具有强大的编程和推理能力。其发布的Claude Code功能,允许开发者通过自然语言命令理解、浏览和修改代码库,加速bug修复、功能实现等任务。

30 年码龄程序员 4 年都没搞定的 bug,Claude Opus 4 只用几个小时轻松破解了。

全程只需 30 个 prompt+1 次重启

而人类在过去 4 年花了至少 200 个小时,都没找到这个 bug 在哪。

一位资深 C++ 程序员的分享,最近火了。

要知道,他曾在 FAANG_(指 Meta、亚马逊、苹果、奈飞、谷歌硅谷五巨头)_担任工程师,如今也是团队中 “定海神针” 一样的人物。

这个 bug 不仅困扰他,包括 GPT-4.1、Gemini-2.5 以及 Claude-3.7 也找不到。

有围观的程序员表示,这种剧情他也经历过!

一个月没解决的 bug,用 o1-Pro 十分钟就搞定了。

Anthropic 的开发者关系主管也留言表示,这样的故事可能会越来越常见。

6 万行代码重构后出现 “白鲸 bug”

故事的主角名叫 ShelZuuz。

这位老哥自称有 30 年 C++ 开发经验,在目前的团队里承担 “技术支援” 的角色,大家卡了一周的问题,他当场就能解决。

从他在 Reddit 上的资料来看,这些介绍应该不是吹水,他 7 年来发布的帖子都是和 hacker、硬件等相关。

然鹅大佬也有解决不了的难题。

4 年前,因为一次设计 6 万行代码的大规模重构,系统里突然出现了一个 bug:在一个特定 shader(着色器)被特定使用方式下,出现了一个边界条件下的问题。

大概就是在一种非常特殊的组合条件下才会触发渲染错误,平时难以察觉,但只要触发就会出错,属于典型的顽固型 bug

ShelZuuz 老哥表示,这个 bug 业务优先级不那么高,但也很烦人。在系统没有重构前,这个 bug 并不存在。

过去几年里,他一直在尝试解决这个问题,零零碎碎花了有 200 个小时时间,都没能定位和修复它。

因此,他把这个 bug 称为 “白鲸 bug”

这是参考了文学作品《白鲸》中,哈克船长执着半生都在追逐一头行动诡异的白鲸。

这不,最近 Claude Opus 4 发布了么,老哥就想着用它试试看。

结果配合着 Claude Code 模式,只用几个小时,这个 bug 就被解决了。

Claude Opus 4 不仅提供了系统重构前后的完整代码,并且明确说明了为什么在新架构下会出问题:

定位 bug 全程只用了 33 个提示词(大概几个小时)、外加一次重启。

老哥表示,他之前尝试过 GPT-4.1、Gemini 2.5、Claude 3.7 等高级 AI 模型,但这些模型都没能找到头绪,Opus 4 是第一个成功定位问题的。

有人就简单算了笔账:这样级别的工程师,200 小时工时费 2.5 万美元起步,而 Claude 订阅费只要 200 美元(doge)。

也有人补充说,这个结果一定程度上也取决于提示词的质量,但不得不承认 Claude 在编程方面真的很强。

Claude Opus 4 重新定义编码模型上限

就在上周,Claude 4 系列上新,其中 Claude Opus 4 是旗舰款。

从官方发布中可以明显感知到,Claude 系列正在猛猛提升自己的编程和推理能力。

展示能力的方式都变成了连续 24 小时畅玩宝可梦、独立运行并持续编码 7 小时……

同时还发布了 Claude Code,也就是前面 ShelZuuz 用到的能力。

这个智能代码助手可以帮助开发者通过自然语言命令理解、浏览和修改整个代码库,让你能够将修复 bug、实现新功能、代码重构、编写测试、跨文件修改等大量工程任务交给 AI 完成。

发布几天时间里,全球的开发者们都在尝试用 Claude 4 解决各种编程代码问题。

当然也衍生了一些有趣的玩法,比如让它用 ASCII 来张自画像。

嗯…… 怎么有点 ET 的感觉?

参考链接:

 [1]www.reddit.com/r/ClaudeAI/…
[2]x.com/deedydas/st…

—  —

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Claude Opus 4 编程 AI bug修复
相关文章