Claude 4破解困扰人类4年系统bug，30年码龄程序员200小时没搞定，GPT-4.1/Gemini-2.5也做不到

量子位前天 21:44

Claude 4破解困扰人类4年系统bug，30年码龄程序员200小时没搞定，GPT-4.1/Gemini-2.5也做不到

一位拥有30年经验的资深C++程序员，耗时四年未能解决的“白鲸bug”，最终被Claude Opus 4在短短几个小时内成功破解。该bug源于6万行代码重构后出现的边界条件问题，此前包括GPT-4.1、Gemini 2.5等AI模型均未能解决。Claude Opus 4不仅提供了新旧代码，还解释了bug产生的原因，即新架构未考虑旧架构中的“非设计性行为”。这一案例展示了Claude Opus 4强大的编程能力和推理能力，以及AI在代码调试方面的巨大潜力，或将成为开发者的新助手。

🐛 Claude Opus 4 成功解决了困扰一位资深程序员四年之久的“白鲸bug”，该bug是由于一次6万行代码的大规模重构后产生的，属于一种非常特殊的组合条件下才会触发的渲染错误。

💡 Claude Opus 4 不仅提供了系统重构前后的完整代码，还明确说明了bug产生的原因，即旧架构“巧合”地支持了某种用法，而新架构没有考虑到这种“非设计性行为”，从而导致bug的出现。

⚙️ Claude Code是Claude Opus 4新推出的智能代码助手，它可以通过自然语言命令帮助开发者理解、浏览和修改整个代码库，从而完成修复bug、实现新功能、代码重构、编写测试等任务。

关注前沿科技 2025-05-28 12:23 四川

只需30个prompt＋1次重启

明敏发自凹非寺量子位 | 公众号 QbitAI

30年码龄程序员4年都没搞定的bug，Claude Opus 4只用几个小时轻松破解了。

全程只需30个prompt+1次重启。

而人类在过去4年花了至少200个小时，都没找到这个bug在哪。

一位资深C++程序员的分享，最近火了。

要知道，他曾在FAANG（指Meta、亚马逊、苹果、奈飞、谷歌硅谷五巨头）担任工程师，如今也是团队中“定海神针”一样的人物。

这个bug不仅困扰他，包括GPT-4.1、Gemini-2.5以及Claude-3.7也找不到。

有围观的程序员表示，这种剧情他也经历过！

一个月没解决的bug，用o1-Pro十分钟就搞定了。

Anthropic的开发者关系主管也留言表示，这样的故事可能会越来越常见。

6万行代码重构后出现“白鲸bug”

故事的主角名叫ShelZuuz。

这位老哥自称有30年C++开发经验，在目前的团队里承担“技术支援”的角色，大家卡了一周的问题，他当场就能解决。

从他在Reddit上的资料来看，这些介绍应该不是吹水，他7年来发布的帖子都是和hacker、硬件等相关。

然鹅大佬也有解决不了的难题。

4年前，因为一次设计6万行代码的大规模重构，系统里突然出现了一个bug：在一个特定shader（着色器）被特定使用方式下，出现了一个边界条件下的问题。

大概就是在一种非常特殊的组合条件下才会触发渲染错误，平时难以察觉，但只要触发就会出错，属于典型的顽固型bug。

ShelZuuz老哥表示，这个bug业务优先级不那么高，但也很烦人。在系统没有重构前，这个bug并不存在。

过去几年里，他一直在尝试解决这个问题，零零碎碎花了有200个小时时间，都没能定位和修复它。

因此，他把这个bug称为“白鲸bug”。

这是参考了文学作品《白鲸》中，哈克船长执着半生都在追逐一头行动诡异的白鲸。

这不，最近Claude Opus 4发布了么，老哥就想着用它试试看。

结果配合着Claude Code模式，只用几个小时，这个bug就被解决了。

Claude Opus 4不仅提供了系统重构前后的完整代码，并且明确说明了为什么在新架构下会出问题：

旧架构下只是“巧合”地支持了这种用法；

而新架构没有考虑到这种“非设计性行为”，所以失效；

这并不是常规意义上的逻辑Bug，而是架构层面的兼容性丢失，一种很难发现的问题。

定位bug全程只用了33个提示词（大概几个小时）、外加一次重启。

老哥表示，他之前尝试过GPT-4.1、Gemini 2.5、Claude 3.7等高级AI模型，但这些模型都没能找到头绪，Opus 4是第一个成功定位问题的。

有人就简单算了笔账：这样级别的工程师，200小时工时费2.5万美元起步，而Claude订阅费只要200美元（doge）。

也有人补充说，这个结果一定程度上也取决于提示词的质量，但不得不承认Claude在编程方面真的很强。

Claude Opus 4重新定义编码模型上限

就在上周，Claude 4系列上新，其中Claude Opus 4是旗舰款。

从官方发布中可以明显感知到，Claude系列正在猛猛提升自己的编程和推理能力。

展示能力的方式都变成了连续24小时畅玩宝可梦、独立运行并持续编码7小时……

同时还发布了Claude Code，也就是前面ShelZuuz用到的能力。

这个智能代码助手可以帮助开发者通过自然语言命令理解、浏览和修改整个代码库，让你能够将修复bug、实现新功能、代码重构、编写测试、跨文件修改等大量工程任务交给AI完成。

发布几天时间里，全球的开发者们都在尝试用Claude 4解决各种编程代码问题。

当然也衍生了一些有趣的玩法，比如让它用ASCII来张自画像。

嗯……怎么有点ET的感觉？

参考链接：

[1]https://www.reddit.com/r/ClaudeAI/comments/1kvgg7s/claude_opus_solved_my_white_whale_bug_today_that/?share_id=-Y9J9Hna8rIemyMsG8Jp9&utm_content=1&utm_medium=ios_app&utm_name=ioscss&utm_source=share&utm_term=1[2]https://x.com/deedydas/status/1927188036560760844

— 完 —

📪 量子位AI主题策划正在征集中！欢迎参与专题365行AI落地方案，一千零一个AI应用，或与我们分享你在寻找的AI产品，或发现的AI新动向。

💬 也欢迎你加入量子位每日AI交流群，一起来畅聊AI吧～

一键关注 👇 点亮星标

科技前沿进展每日见

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Claude Opus 代码调试人工智能编程 bug修复

相关文章

人工智能正在摧毁互联网内容生态系统

阿里云：通义千问API日调用量破亿企业用户破9万

【iThome 2024 CIO大調查系列1】AI、資安和永續變革三箭齊發

鈺登跨入AI，推出搭配英特爾四代Xeon SP與Gaudi2的伺服器

蘋果發表M4晶片，更新iPad產品線

Red Hat推出AI平臺，內建IBM開源Granite模型

【iThome 2024 CIO大調查系列 1｜IT投資趨勢】IT投資布局更多角化，雲端比重明顯增加