Anthropic釋出Claude Opus 4.1，強化代理任務、程式碼與推理能力

Anthropic周二（8/5）釋出Claude Opus 4.1，稱其為Claude Opus 4在代理任務、真實世界程式碼撰寫與推理能力上的升級版，並預告將在未來數周發表更大幅度的模型升級。

Opus系列是Claude模型家族中最強的等級。根據Anthropic公布的基準測試結果，Claude Opus 4.1在多數項目中表現超越Opus 4，並於代理程式碼任務（SWE-bench Verified、Terminal-Bench）、代理工具使用（TAU-bench）、以及多語言問答任務（MMMU）等測試中，領先OpenAI的o3與Gemini 2.5 Pro。

Claude Opus 4.1被視為當前最強的程式碼模型之一，可更準確地辨識並修復錯誤、有效處理多檔案重構，並減少冗贅與錯誤的產生。

目前Claude Opus 4.1已可透過Claude Code、API、Amazon Bedrock與Google Cloud Vertex AI等平臺存取，並已在GitHub Copilot中開放預覽，預計兩周後將正式取代Opus 4。定價維持不變，每百萬個Token輸入15美元、輸出75美元。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签