Cnbeta 9小时前
Claude 4.1 发布:更强的Agent、代码和推理
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Claude Opus 4.1 模型发布,性能全面提升。在编程、写作、工具调用及Agent方面表现优异,支持长程任务和复杂流程。价格不变,API已开放,网页端可用。

💡 Agent能力提升:能处理长时程任务,优化复杂企业流程,TAU-bench表现优异。

🔧 高级编程:完成上千步骤长程编程,支持32k下文输出,SWE-bench得分74.5%。

🔍 搜索增强:独立执行数小时研究,有效整合内外信息,提升搜索效率。

✍️ 写作优化:更接近人类写作风格,基准测试数据全面超越旧版本。

📈 性价比高:性能增强但价格不变,API开放,网页端支持Pro/Max/Team用户。

今天凌晨,Claude Opus 4.1 模型发布,Pro/Max/Team 用户可在网页端使用,API 已开放。Claude.ai 已可使用,性能更强,价格不变。



能力全面提升

按 Anthropic 的官方说法,Claude Opus 4.1 是 Opus 4 的直接替代品 ,在编程、写作、工具调用以及Agent 方面,都得到了全面提升

• Agent 能力:能准确处理长时程任务,以及复杂企业工作流程,在TAU-bench表现优异;

• 高级编程:能完成上千步骤的长程编程任务,支持单次 32k 下文输出;

• 更强的搜索:能独立进行数小时研究任务,更为有效的进行内外信息搜索;

• 更强的写作:写的更像人

根据公开基准测试数据,Claude Opus4.1 在各个榜单上,都完成了对老版本的超越,详细如下图。


编程相关跑分

这里专门说一下 SWE-bench 榜单,这是一个编程榜单。

榜单中,Opus 4.1 得分为 74.5% 为最高,紧随其后的是 Claude Sonnet 4,下图是更为具体的数据


SWE-bench

附录

附1:Claude Opus 4.1 信息卡/技术报告


https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf附2:相关链接

Claude Webapp

www.claude.ai

Claude Opus 官方信息

https://www.anthropic.com/claude/opus

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Claude Opus 4.1 AI模型 性能提升
相关文章