掘金 人工智能 05月24日 10:18
Claude 4 震撼发布:编程能力登顶,智能体迈入新时代!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Anthropic推出了新一代Claude 4模型,包括Opus 4和Sonnet 4,在编程、推理和AI智能体应用方面实现了显著提升。Opus 4作为最强编程模型,在复杂任务和智能体流程中表现出色,而Sonnet 4则在性能和效率上提供了更实用的组合。新模型增强了推理、工具调用和记忆能力,并推出了Claude Code,扩展了开发者与Claude的协作方式。Opus 4和Sonnet 4均已在Anthropic API、Amazon Bedrock和Google Cloud Vertex AI平台上线,为开发者提供了更强大的工具。

🚀 **新模型发布:** Anthropic发布了Claude Opus 4和Claude Sonnet 4,两款模型均增强了推理与工具调用功能,支持并行调用多个工具,并提升了记忆能力,能够通过访问本地文件来提升上下文理解。

💡 **Claude Opus 4:** 作为目前全球最强编程模型,Opus 4在复杂和持续运行的任务以及智能体流程中表现出色,尤其在编程和复杂问题解决方面表现突出,为前沿智能体产品发展提供了强大支持。

✨ **Claude Sonnet 4:** Sonnet 4在Sonnet 3.7的基础上进行了重大升级,提升了模型的可控性,在兼顾性能与效率的同时,提供了更实用的性能组合,尤其在智能体场景表现卓越,并提升了用户日常工作效率。

💻 **Claude Code:** Claude Code正式发布,扩展了开发者与Claude的协作方式,支持终端使用、主流IDE集成,并可后台运行。新功能包括VS Code与JetBrains的测试版扩展,使得代码审查与追踪更加便捷。

本文已收录在Github关注我,紧跟本系列专栏文章,咱们下篇再续!

0 前言

Claude 一边处理多个任务的插图:

Anthropic今天正式推出Claude模型新一代产品:Claude Opus 4Claude Sonnet 4,编程能力、高阶推理以及AI智能体应用方面设立全新标准:

1 新功能

Claude Opus 4与Sonnet 4属混合型模型,支持两种运行模式:

Pro、Max、Team和Enterprise订阅用户可使用两个模型及其扩展推理功能,免费用户也可用Sonnet 4。这两款模型已上线Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI平台,价格与此前版本保持一致:


2 Claude 4

Anthropic目前最强大模型,也是全球顶尖编程模型,在SWE-bench(72.5%)和Terminal-bench(43.2%)领先。在需持续专注数小时的大型任务中表现出色,远超所有Sonnet模型,大幅提升AI智能体的执行能力。

Claude Opus 4在编程和复杂问题解决方面表现尤为出色,推动了

2.1 前沿智能体产品发展

Claude Sonnet 4在Sonnet 3.7基础明显提升,SWE-bench成绩达72.7%,在兼顾性能与效率的同时,增强模型可控性。虽多数场景不及Opus 4,但提供更实用性能组合。

2.2 实用性能组合

这些模型全面推动客户的AI战略:Opus 4在编程、科研、写作和科学发现等领域突破边界,而Sonnet 4则以更高性价比提升日常工作效率,是Sonnet 3.7的理想升级。

Claude在软件工程任务中的对比图

Claude 4模型在SWE-bench Verified测试中领先,这是一个真实软件工程任务的性能基准。

Claude 4系列在编程、推理、多模态能力及智能体任务中均表现出色。


3 模型改进

除了扩展推理、并行工具使用与记忆能力提升外,我们大幅减少了模型在完成任务时“走捷径”或利用“漏洞”的行为。在特别容易出现这些行为的智能体任务中,新模型发生此类情况的概率比Sonnet 3.7低65%。

Opus 4在记忆能力方面也远超以往模型。当开发者允许其访问本地文件时,它能高效创建并维护“记忆文件”,记录关键信息,提升长期任务的连贯性与表现。

最后,我们为Claude 4引入了“思考摘要”功能,可利用小模型浓缩复杂的思维过程。仅约5%的情况下需要进行摘要,大多数推理过程足够简洁可完整展示。


4 Claude Code

现已全面开放的Claude Code,将Claude的强大功能延伸至您的开发流程中:支持终端使用、主流IDE集成、并可后台运行。

为VS Code与JetBrains推出了测试版扩展,Claude提出的代码修改将直接显示在文件中,使代码审查与追踪更加便捷。在IDE终端中运行Claude Code即可安装。

还发布了可扩展的Claude Code SDK,方便您基于其核心构建自己的智能体与应用。还提供了一个示例:GitHub上的Claude Code(测试版)。在PR中标记Claude Code,即可自动响应审查意见、修复CI错误或修改代码。安装方式:在Claude Code中运行/install-github-app。


5 快速上手

这些模型是迈向“虚拟协作者”的重要一步——能保持完整上下文、持续专注长期项目,并带来颠覆性成果。我们进行了大量测试与评估,以最大限度地降低风险并确保安全,包括启用ASL-3等级保护措施

本文由博客一文多发平台 OpenWrite 发布!

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Claude 4 Anthropic 人工智能 编程模型 AI智能体
相关文章