Claude 4 破解困扰人类 4 年系统 bug，30 年码龄程序员 200 小时没搞定，GPT-4.1/Gemini-2.5 也做不到

30 年码龄程序员 4 年都没搞定的 bug，Claude Opus 4 只用几个小时轻松破解了。

全程只需 30 个 prompt+1 次重启。

而人类在过去 4 年花了至少 200 个小时，都没找到这个 bug 在哪。

一位资深 C++ 程序员的分享，最近火了。

要知道，他曾在 FAANG_（指 Meta、亚马逊、苹果、奈飞、谷歌硅谷五巨头）_担任工程师，如今也是团队中 “定海神针” 一样的人物。

这个 bug 不仅困扰他，包括 GPT-4.1、Gemini-2.5 以及 Claude-3.7 也找不到。

有围观的程序员表示，这种剧情他也经历过！

一个月没解决的 bug，用 o1-Pro 十分钟就搞定了。

Anthropic 的开发者关系主管也留言表示，这样的故事可能会越来越常见。

6 万行代码重构后出现 “白鲸 bug”

故事的主角名叫 ShelZuuz。

这位老哥自称有 30 年 C++ 开发经验，在目前的团队里承担 “技术支援” 的角色，大家卡了一周的问题，他当场就能解决。

从他在 Reddit 上的资料来看，这些介绍应该不是吹水，他 7 年来发布的帖子都是和 hacker、硬件等相关。

然鹅大佬也有解决不了的难题。

4 年前，因为一次设计 6 万行代码的大规模重构，系统里突然出现了一个 bug：在一个特定 shader（着色器）被特定使用方式下，出现了一个边界条件下的问题。

大概就是在一种非常特殊的组合条件下才会触发渲染错误，平时难以察觉，但只要触发就会出错，属于典型的顽固型 bug。

ShelZuuz 老哥表示，这个 bug 业务优先级不那么高，但也很烦人。在系统没有重构前，这个 bug 并不存在。

过去几年里，他一直在尝试解决这个问题，零零碎碎花了有 200 个小时时间，都没能定位和修复它。

因此，他把这个 bug 称为 “白鲸 bug”。

这是参考了文学作品《白鲸》中，哈克船长执着半生都在追逐一头行动诡异的白鲸。

这不，最近 Claude Opus 4 发布了么，老哥就想着用它试试看。

结果配合着 Claude Code 模式，只用几个小时，这个 bug 就被解决了。

Claude Opus 4 不仅提供了系统重构前后的完整代码，并且明确说明了为什么在新架构下会出问题：

旧架构下只是 “巧合” 地支持了这种用法；

而新架构没有考虑到这种 “非设计性行为”，所以失效；

这并不是常规意义上的逻辑 Bug，而是架构层面的兼容性丢失，一种很难发现的问题。

定位 bug 全程只用了 33 个提示词（大概几个小时）、外加一次重启。

老哥表示，他之前尝试过 GPT-4.1、Gemini 2.5、Claude 3.7 等高级 AI 模型，但这些模型都没能找到头绪，Opus 4 是第一个成功定位问题的。

有人就简单算了笔账：这样级别的工程师，200 小时工时费 2.5 万美元起步，而 Claude 订阅费只要 200 美元（doge）。

也有人补充说，这个结果一定程度上也取决于提示词的质量，但不得不承认 Claude 在编程方面真的很强。

就在上周，Claude 4 系列上新，其中 Claude Opus 4 是旗舰款。

从官方发布中可以明显感知到，Claude 系列正在猛猛提升自己的编程和推理能力。

同时还发布了 Claude Code，也就是前面 ShelZuuz 用到的能力。

这个智能代码助手可以帮助开发者通过自然语言命令理解、浏览和修改整个代码库，让你能够将修复 bug、实现新功能、代码重构、编写测试、跨文件修改等大量工程任务交给 AI 完成。

发布几天时间里，全球的开发者们都在尝试用 Claude 4 解决各种编程代码问题。

当然也衍生了一些有趣的玩法，比如让它用 ASCII 来张自画像。

嗯…… 怎么有点 ET 的感觉？

参考链接：

— 完 —