Anthropic周二(8/5)釋出Claude Opus 4.1,稱其為Claude Opus 4在代理任務、真實世界程式碼撰寫與推理能力上的升級版,並預告將在未來數周發表更大幅度的模型升級。
Opus系列是Claude模型家族中最強的等級。根據Anthropic公布的基準測試結果,Claude Opus 4.1在多數項目中表現超越Opus 4,並於代理程式碼任務(SWE-bench Verified、Terminal-Bench)、代理工具使用(TAU-bench)、以及多語言問答任務(MMMU)等測試中,領先OpenAI的o3與Gemini 2.5 Pro。
Claude Opus 4.1被視為當前最強的程式碼模型之一,可更準確地辨識並修復錯誤、有效處理多檔案重構,並減少冗贅與錯誤的產生。
目前Claude Opus 4.1已可透過Claude Code、API、Amazon Bedrock與Google Cloud Vertex AI等平臺存取,並已在GitHub Copilot中開放預覽,預計兩周後將正式取代Opus 4。定價維持不變,每百萬個Token輸入15美元、輸出75美元。