Anthropic發布Claude Opus 4與Claude Sonnet 4，前者號稱是全球最強大的程式碼撰寫模型

AI & Big Data 05月23日 14:23

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

Anthropic发布新一代Claude模型系列，包括Claude Opus 4和Claude Sonnet 4。其中，Claude Opus 4被誉为全球最强大的代码编写模型，尤其在长期任务执行和复杂代码理解方面表现出色。新模型在多种测试中超越竞争对手，并在代理任务中减少了使用捷径的行为。Claude Sonnet 4则侧重于平衡性能与实用性，适用于日常应用。多家科技公司对新模型给予高度评价，GitHub也将在其Copilot中使用Claude Sonnet 4。

💻 **Claude Opus 4的核心优势：** Claude Opus 4是Anthropic新推出的旗舰模型，被定位为全球最强大的代码编写模型。它在软件工程流程测试SWE-bench上达到72.5%的成绩，在命令列操作能力Terminal-bench测试中获得43.2%的分数，均超越了OpenAI o3和Gemini 2.5 Pro。此外，Opus 4能够持续工作数小时，在需要数千步骤的长期任务中保持稳定表现。

🚀 **Claude Sonnet 4的特点：** Claude Sonnet 4在保持高效率的同时，显著提升了代码编写和推理能力。它在性能与实用性之间取得了良好平衡，更适合日常使用场景。GitHub已宣布在GitHub Copilot的新代码编写代理中使用Claude Sonnet 4作为基础模型。

💡 **新模型的关键改进：** Claude Opus 4和Claude Sonnet 4都属于混合模型，提供两种模式：近乎即时的回应和深入推理的延伸性思考。它们都可以在延伸思考期间使用各种工具来改善回应，更准确地遵循指令，并具有更好的记忆力。Anthropic还减少了这两个模型在执行任务时使用捷径或钻漏洞的行为。

💰 **定价与服务：** Pro、Max、Team和Enterprise计划都包含这两款模型和延伸性思考功能，已通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上提供服务。在定价上，Claude Opus 4每百万token输入/输出价格为15/75美元，Claude Sonnet 4则是3/15美元，与上一代模型一致。

AI新創Anthropic今日（5/23）推出新一代Claude模型系列：Claude Opus 4和Claude Sonnet ，並將Claude Opus 4稱為全球最強大的程式碼撰寫模型，在長期任務執行與理解複雜程式碼上都有傑出的表現。

Claude Opus 4和Claude Sonnet 4屬於混合模型，提供兩種模式以供切換，分別是近乎即時的回應，以及深入推理的延伸性思考；此外，它們都可以在延伸思考期間使用各種工具來改善回應；能更準確地遵循指令；並有更好的記憶力。此外，Anthropic也減少了這兩個模型在執行任務時使用捷徑或鑽漏洞的行為，相較於Sonnet 3.7執行代理任務時，新模型參與相關行為的可能性低了65%。

Anthropic特別強調Claude Opus 4在撰寫程式碼的能力。該模型在軟體工程流程測試SWE-bench上達到72.5%的成績，Claude Sonnet 4於該測試也取得了72.7%的成績，超越OpenAI o3的69.1%及Gemini 2.5 Pro的63.2%；Claude Opus 4在命令列操作能力Terminal-bench測試中獲得43.2%的分數，超越Claude Sonnet 4的35.5%、OpenAI o3的30.2%與Gemini 2.5 Pro的25.3%。更令人矚目的是，Opus 4能夠持續工作數小時，在需要數千步驟的長期任務中保持穩定表現，這為AI代理的應用範圍帶來了革命性擴展。

圖片來源／Anthropic

至於Claude Sonnet 4在保持高效率的同時，顯著提升了程式碼撰寫和推理能力，在平衡性能與實用性方面表現出色，適用於日常使用場景。

多家科技業者對Claude Opus 4給予了高度評價。程式碼編輯器公司Cursor說它在複雜程式碼庫理解上有著飛躍式進步；網路開發平臺Replit說它在跨不同文件之變更的精確度上，有了明顯的改善；區塊鏈開發公司Block表示，Claude Opus 4是首個能在程式碼編輯與除錯過程中，實際提升程式碼品質的模型；日本電商巨頭樂天（Rakuten）則藉由一項長達7小時的開源重構任務，驗證了該模型的能力，期間該模型完全獨立運作並維持穩定表現。

而其實Claude Sonnet 4在代理場景的表現也不差，而且處理速度更快，因此，GitHub已宣布要在GitHub Copilot 中的新程式碼撰寫代理中，採用Claude Sonnet 4作為基礎模型。

Pro、Max、Team和Enterprise計畫都包含兩款模型和延伸性思考功能，已透過Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上提供服務。在定價上，Claude Opus 4每百萬token輸入/輸出價格為15/75美元，Claude Sonnet 4則是3/15美元，與上一代模型一致。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签