Vibe编程公司表示，Claude 4将语法错误减少了25%。

安全客 11小时前

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

Anthropic推出了Claude Sonnet 4和Claude Opus 4两款新模型，其中Opus 4在编码方面表现更出色。Vibe编码公司Lovable在使用Claude 4后，发现其工具的错误减少了25%，整体速度提高了40%。创始人Anton Osika表示，Claude 4几乎消除了Lovable的大部分错误，尤其是在氛围编码时的LLM语法错误方面。尽管谷歌的Gemini 2.5 Pro拥有更大的上下文窗口，但Claude 4在某些编码任务中仍然表现出色。混合使用不同的模型，例如使用o3或Gemini进行规划，使用Claude 4和Gemini进行编码，可能是一个不错的选择。

🚀 Anthropic发布Claude Opus 4，编码能力增强，在软件工程基准测试SWE中得分72.5%，展现了在长期任务中的持续性能。

✅ Lovable公司在使用Claude 4后，其基于AI的Web和应用程序构建工具的错误率降低了25%，整体速度提升了40%。

🤖 Claude 4在处理Dart/Kotlin应用程序时，相较于Gemini，产生的错误代码更少，但在具体项目中的表现取决于上下文和快速工程的技巧。

🌐 尽管Gemini 2.5 Pro拥有100万的上下文窗口，但Claude 4在编码方面仍具有竞争力，混合使用不同模型可能是更优的解决方案。

克劳德

Lovable是一个Vibe编码工具,它说Claude 4已经将其错误减少了25%,并使其更快了40%。

5月22日,Anthropic开始推出两款新车型:Claude Sonnet 4和Claude Opus 4。虽然Sonnet可供免费用户使用,但Opus需要付费订阅,并且在编码方面能够比Sonnet做得更好。

在一篇博客文章中,Anthropic证实Claude Opus 4在SWE板凳上得分为72.5%(SWE是软件工程基准的缩写)。

克劳德 4

在测试中,Opus 4在需要集中努力和数千步的长期任务中提供了持续的性能。

Anthropic还声称其最新型号连续工作了7个小时。

Vibe编码公司Lovable在其“基于AI的基于提示的Web和应用程序构建器”工具中使用Claude,在升级到Claude 4之后也观察到了类似的改进。

在X的一篇文章中,Lovable表示,在部署Claude 4用于所有项目(包括旧项目)的项目创建和编辑后,它的错误减少了25%,整体速度提高了40%。

在另一篇文章中,Lovable创始人安东·奥西卡(Anton Osika)证实,“克劳德4只是抹去了大部分Lovable的错误”,同时特别提到了在氛围编码时的LLM语法错误。

克劳德4是编码的好模型

虽然对克劳德4的看法仍然参差不齐,但我个人注意到,当我在研究Dart / Kotlin应用程序时,Claude 4确实会产生比Gemini更少的代码。

这取决于项目到项目和上下文,但在不需要更长上下文的项目中,克劳德4在我的测试中比双子座做得更好。

克劳德模型一直保持着“最擅长编码”的声誉,但最近谷歌的竞争激烈,谷歌发布了Gemini 2.5 Pro,有100万个上下文窗口。

与Claude 4或更老型号的20万个上下文窗口相比,Gemini 2.5的100万个上下文窗口确实给它带来了优势。但这并不一定意味着双子座2.5在编码方面比克劳德4更好。

两者都可以令人惊讶地出色,同时也很糟糕,这也归结为你如何进行快速工程。

混合模型总是很好,例如用于规划的o3或双子座和用于编码的Claude 4和Gemini。

克劳德4是编码的好模型

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签