Lovable是一个Vibe编码工具,它说Claude 4已经将其错误减少了25%,并使其更快了40%。
5月22日,Anthropic开始推出两款新车型:Claude Sonnet 4和Claude Opus 4。虽然Sonnet可供免费用户使用,但Opus需要付费订阅,并且在编码方面能够比Sonnet做得更好。
在一篇博客文章中,Anthropic证实Claude Opus 4在SWE板凳上得分为72.5%(SWE是软件工程基准的缩写)。
🚀 Anthropic发布Claude Opus 4,编码能力增强,在软件工程基准测试SWE中得分72.5%,展现了在长期任务中的持续性能。
✅ Lovable公司在使用Claude 4后,其基于AI的Web和应用程序构建工具的错误率降低了25%,整体速度提升了40%。
🤖 Claude 4在处理Dart/Kotlin应用程序时,相较于Gemini,产生的错误代码更少,但在具体项目中的表现取决于上下文和快速工程的技巧。
🌐 尽管Gemini 2.5 Pro拥有100万的上下文窗口,但Claude 4在编码方面仍具有竞争力,混合使用不同模型可能是更优的解决方案。
Lovable是一个Vibe编码工具,它说Claude 4已经将其错误减少了25%,并使其更快了40%。
5月22日,Anthropic开始推出两款新车型:Claude Sonnet 4和Claude Opus 4。虽然Sonnet可供免费用户使用,但Opus需要付费订阅,并且在编码方面能够比Sonnet做得更好。
在一篇博客文章中,Anthropic证实Claude Opus 4在SWE板凳上得分为72.5%(SWE是软件工程基准的缩写)。
在测试中,Opus 4在需要集中努力和数千步的长期任务中提供了持续的性能。
Anthropic还声称其最新型号连续工作了7个小时。
Vibe编码公司Lovable在其“基于AI的基于提示的Web和应用程序构建器”工具中使用Claude,在升级到Claude 4之后也观察到了类似的改进。
在X的一篇文章中,Lovable表示,在部署Claude 4用于所有项目(包括旧项目)的项目创建和编辑后,它的错误减少了25%,整体速度提高了40%。
在另一篇文章中,Lovable创始人安东·奥西卡(Anton Osika)证实,“克劳德4只是抹去了大部分Lovable的错误”,同时特别提到了在氛围编码时的LLM语法错误。
虽然对克劳德4的看法仍然参差不齐,但我个人注意到,当我在研究Dart / Kotlin应用程序时,Claude 4确实会产生比Gemini更少的代码。
这取决于项目到项目和上下文,但在不需要更长上下文的项目中,克劳德4在我的测试中比双子座做得更好。
克劳德模型一直保持着“最擅长编码”的声誉,但最近谷歌的竞争激烈,谷歌发布了Gemini 2.5 Pro,有100万个上下文窗口。
与Claude 4或更老型号的20万个上下文窗口相比,Gemini 2.5的100万个上下文窗口确实给它带来了优势。但这并不一定意味着双子座2.5在编码方面比克劳德4更好。
两者都可以令人惊讶地出色,同时也很糟糕,这也归结为你如何进行快速工程。
混合模型总是很好,例如用于规划的o3或双子座和用于编码的Claude 4和Gemini。
AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。
鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑