Claude 4.1 发布：更强的Agent、代码和推理

Cnbeta 9小时前

Claude 4.1 发布：更强的Agent、代码和推理

Claude Opus 4.1 模型发布，性能全面提升。在编程、写作、工具调用及Agent方面表现优异，支持长程任务和复杂流程。价格不变，API已开放，网页端可用。

💡 Agent能力提升：能处理长时程任务，优化复杂企业流程，TAU-bench表现优异。

🔧 高级编程：完成上千步骤长程编程，支持32k下文输出，SWE-bench得分74.5%。

🔍 搜索增强：独立执行数小时研究，有效整合内外信息，提升搜索效率。

✍️ 写作优化：更接近人类写作风格，基准测试数据全面超越旧版本。

📈 性价比高：性能增强但价格不变，API开放，网页端支持Pro/Max/Team用户。

今天凌晨，Claude Opus 4.1 模型发布，Pro/Max/Team 用户可在网页端使用，API 已开放。Claude.ai 已可使用，性能更强，价格不变。

能力全面提升

按 Anthropic 的官方说法，Claude Opus 4.1 是 Opus 4 的直接替代品，在编程、写作、工具调用以及Agent 方面，都得到了全面提升

• Agent 能力：能准确处理长时程任务，以及复杂企业工作流程，在TAU-bench表现优异；

• 高级编程：能完成上千步骤的长程编程任务，支持单次 32k 下文输出；

• 更强的搜索：能独立进行数小时研究任务，更为有效的进行内外信息搜索；

• 更强的写作：写的更像人

根据公开基准测试数据，Claude Opus4.1 在各个榜单上，都完成了对老版本的超越，详细如下图。

编程相关跑分

这里专门说一下 SWE-bench 榜单，这是一个编程榜单。

榜单中，Opus 4.1 得分为 74.5% 为最高，紧随其后的是 Claude Sonnet 4，下图是更为具体的数据

SWE-bench

附录

附1：Claude Opus 4.1 信息卡/技术报告

https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf附2：相关链接

Claude Webapp

www.claude.ai

Claude Opus 官方信息

https://www.anthropic.com/claude/opus

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Claude Opus 4.1 AI模型性能提升

相关文章

Meta据悉正与出版商讨论人工智能模型训练合作

【臺灣RMN實例：Pinkoi】以垂直領域數據自建模型，從自動化進階AI化投廣

Developments in Family of Claude Models by Anthropic AI: A Comprehensive Review

Microsoft’s New Category of Windows PCs designed for AI, Copilot+ PCs

AI News Weekly - Issue #387: 10 Best AI PDF Summarizers - May 30th 2024

NASA and IBM Research Have Developed a New Artificial Intelligence Model

Comment on US and EU agree to collaborate on improving lives with AI by Don

Perplexity: ↩️ For more ? https://www.raycast.com/blog/more-ai-models

Show HN: 开源 LLM 补丁流 - 速度和输出令牌改进

一种名为 "RAG "的技术能否防止人工智能模型胡编乱造？