AI & Big Data 05月23日 14:23
Anthropic發布Claude Opus 4與Claude Sonnet 4,前者號稱是全球最強大的程式碼撰寫模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Anthropic发布新一代Claude模型系列,包括Claude Opus 4和Claude Sonnet 4。其中,Claude Opus 4被誉为全球最强大的代码编写模型,尤其在长期任务执行和复杂代码理解方面表现出色。新模型在多种测试中超越竞争对手,并在代理任务中减少了使用捷径的行为。Claude Sonnet 4则侧重于平衡性能与实用性,适用于日常应用。多家科技公司对新模型给予高度评价,GitHub也将在其Copilot中使用Claude Sonnet 4。

💻 **Claude Opus 4的核心优势:** Claude Opus 4是Anthropic新推出的旗舰模型,被定位为全球最强大的代码编写模型。它在软件工程流程测试SWE-bench上达到72.5%的成绩,在命令列操作能力Terminal-bench测试中获得43.2%的分数,均超越了OpenAI o3和Gemini 2.5 Pro。此外,Opus 4能够持续工作数小时,在需要数千步骤的长期任务中保持稳定表现。

🚀 **Claude Sonnet 4的特点:** Claude Sonnet 4在保持高效率的同时,显著提升了代码编写和推理能力。它在性能与实用性之间取得了良好平衡,更适合日常使用场景。GitHub已宣布在GitHub Copilot的新代码编写代理中使用Claude Sonnet 4作为基础模型。

💡 **新模型的关键改进:** Claude Opus 4和Claude Sonnet 4都属于混合模型,提供两种模式:近乎即时的回应和深入推理的延伸性思考。它们都可以在延伸思考期间使用各种工具来改善回应,更准确地遵循指令,并具有更好的记忆力。Anthropic还减少了这两个模型在执行任务时使用捷径或钻漏洞的行为。

💰 **定价与服务:** Pro、Max、Team和Enterprise计划都包含这两款模型和延伸性思考功能,已通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上提供服务。在定价上,Claude Opus 4每百万token输入/输出价格为15/75美元,Claude Sonnet 4则是3/15美元,与上一代模型一致。

AI新創Anthropic今日(5/23)推出新一代Claude模型系列:Claude Opus 4和Claude Sonnet ,並將Claude Opus 4稱為全球最強大的程式碼撰寫模型,在長期任務執行與理解複雜程式碼上都有傑出的表現。

Claude Opus 4和Claude Sonnet 4屬於混合模型,提供兩種模式以供切換,分別是近乎即時的回應,以及深入推理的延伸性思考;此外,它們都可以在延伸思考期間使用各種工具來改善回應;能更準確地遵循指令;並有更好的記憶力。此外,Anthropic也減少了這兩個模型在執行任務時使用捷徑或鑽漏洞的行為,相較於Sonnet 3.7執行代理任務時,新模型參與相關行為的可能性低了65%。

Anthropic特別強調Claude Opus 4在撰寫程式碼的能力。該模型在軟體工程流程測試SWE-bench上達到72.5%的成績,Claude Sonnet 4於該測試也取得了72.7%的成績,超越OpenAI o3的69.1%及Gemini 2.5 Pro的63.2%;Claude Opus 4在命令列操作能力Terminal-bench測試中獲得43.2%的分數,超越Claude Sonnet 4的35.5%、OpenAI o3的30.2%與Gemini 2.5 Pro的25.3%。更令人矚目的是,Opus 4能夠持續工作數小時,在需要數千步驟的長期任務中保持穩定表現,這為AI代理的應用範圍帶來了革命性擴展。

圖片來源/Anthropic

至於Claude Sonnet 4在保持高效率的同時,顯著提升了程式碼撰寫和推理能力,在平衡性能與實用性方面表現出色,適用於日常使用場景。

多家科技業者對Claude Opus 4給予了高度評價。程式碼編輯器公司Cursor說它在複雜程式碼庫理解上有著飛躍式進步;網路開發平臺Replit說它在跨不同文件之變更的精確度上,有了明顯的改善;區塊鏈開發公司Block表示,Claude Opus 4是首個能在程式碼編輯與除錯過程中,實際提升程式碼品質的模型;日本電商巨頭樂天(Rakuten)則藉由一項長達7小時的開源重構任務,驗證了該模型的能力,期間該模型完全獨立運作並維持穩定表現。

而其實Claude Sonnet 4在代理場景的表現也不差,而且處理速度更快,因此,GitHub已宣布要在GitHub Copilot 中的新程式碼撰寫代理中,採用Claude Sonnet 4作為基礎模型。

Pro、Max、Team和Enterprise計畫都包含兩款模型和延伸性思考功能,已透過Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上提供服務。在定價上,Claude Opus 4每百萬token輸入/輸出價格為15/75美元,Claude Sonnet 4則是3/15美元,與上一代模型一致。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Anthropic Claude 4 AI模型 代码编写 人工智能
相关文章