36kr 4小时前
就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Anthropic 在 OpenAI 官宣开源推理模型前抢先发布 Claude Opus 4.1 模型,后者在智能体任务、编程和推理能力上大幅提升,支持 200K 上下文窗口。Claude Opus 4.1 已面向 Pro、Max、Team 和 Enterprise 用户开放,可通过 Anthropic API、Amazon Bedrock 和 Google Cloud Vertex AI 使用。模型在 SWE-bench 基准上表现优异,企业用户反馈其在代码处理上精准高效,支持混合推理模式,典型应用场景包括高级编程和智能体搜索研究。

🔍 Claude Opus 4.1 是 Anthropic 快速迭代的最新模型,基于 Opus 4 构建,在智能体任务、真实世界编程和推理能力上显著提升,支持 200K 上下文窗口,适合商业和个人用户。

💻 对于开发者,Claude Opus 4.1 可通过 Anthropic API、Amazon Bedrock 和 Google Cloud Vertex AI 使用,并已集成至 Claude Code,API 价格为每百万输入 token 15 美元,输出 token 75 美元,启用提示缓存可节省高达 90% 成本。

📈 企业用户反馈 Opus 4.1 在处理大型代码库时精准高效,不会引入新 bug,性能提升相当于 Sonnet 3.7 升级至 Sonnet 4,支持混合推理模式,可精细控制思维预算优化成本。

🔬 在 SWE-bench 基准上表现优异,GitHub 评估显示其在多文件代码重构等方面进步显著,典型应用场景包括高级编程(如完成耗时工程任务)和智能体搜索研究(如分析专利数据库和学术论文)。

🎮 Claude Opus 4.1 仍面临订阅费高和 token 消耗大的问题,且在谷歌 AI 国际象棋比赛中败于 Gemini 2.5 Pro,未来表现引人关注。

你会掏钱吗?

你说巧不巧,就在 Sam Altman 官宣两个开源推理模型之前的半个小时,却被 Anthropic 抢先一步,发布了新模型 Claude Opus 4.1。

以前只有 OpenAI 抢占别人家的风头,这次轮到 OpenAI「被截胡」了!历史总是充满戏剧性!

对比他们发推时间,算下来就是前后脚的功夫,不知是 Anthropic 提前得知了消息,还是刚巧赶上了,又或者是 Anthropic 以为 OpenAI 要发 GPT-5,提前放出模型,时间挨的那么近,应该不是巧合。大家觉得呢?

总之,国外这几家公司上新模型,基本都在按照这个循环进行。

Claude Opus 4.1 登场

最新 Claude Opus 4.1 模型,基于 Claude Opus 4 构建,后者在今年 5 月末发布。可以看出 Anthropic 模型迭代速度还是非常快的。Claude Opus 4.1 主要在智能体任务、真实世界编程和推理能力上有了大幅提升,具有 200K 上下文窗口。

对于商业用户和个人用户而言,Claude Opus 4.1 已面向 Claude Pro、Max、Team 和 Enterprise(企业)用户开放使用。

对于开发者而言,Claude Opus 4.1 可通过以下平台使用:

此外,Claude Opus 4.1 也已集成至 Claude Code 中。

在 API 价格方面,Claude Opus 4.1 的定价为:

如果启用提示缓存(prompt caching),最多可节省 90% 的成本;使用批处理可节省多达 50% 的成本。

定价:https://www.anthropic.com/pricing#api

在性能方面,Opus 4.1 在 SWE-bench Verified 基准上达到 74.5%,此外,该模型还在深度研究和数据分析等方面有所提升,尤其是在细节追踪和智能体搜索方面。

根据 GitHub 评估,Claude Opus 4.1 在大多数能力上相较于 Opus 4 都有所提升,尤其在多文件代码重构方面表现出显著进步。

企业用户方面,Rakuten Group 发现,Opus 4.1 在处理大型代码库时,能够精准定位需要修改的部分,且不会做出不必要的更改或引入新的 bug。这种精确性让他们的团队更愿意在日常调试任务中使用它。

还有企业用户称,在他们的初级开发者评估基准测试中,Opus 4.1 相比 Opus 4 提升幅度很大,其性能飞跃大致相当于 Sonnet 3.7 升级至 Sonnet 4 的提升幅度。

Anthropic 建议所有用户将 Opus 4 升级至 Opus 4.1。在 API 中,开发者只需使用 claude-opus-4-1-20250805 即可接入新版模型。

使用场景

Claude Opus 4.1 提供了混合推理模式,既可以实现即时响应,也可以展示推理过程。API 用户还可对思维预算进行精细控制,以实现成本与性能的最优平衡。

其典型应用场景包括但不限于:

高级编程能力:Claude Opus 4.1 在 SWE-bench 基准上处于领先地位,能够完成耗时数日的工程任务,并在成千上万步操作中提供连贯且具备上下文感知的解决方案。得益于更优的代码品味与 32K 的输出 token 支持,它可以灵活适应特定的编程风格,在大规模代码生成与重构项目中展现出卓越的质量表现。

智能体搜索与研究:Claude Opus 4.1 能够高效地检索外部和内部数据源,在复杂的信息环境中综合出全面的洞见。凭借其在智能体搜索任务中的强大表现,它可以进行长达数小时的自主研究 —— 同时分析包括专利数据库、学术论文和市场报告在内的多种资料,为决策提供战略性洞察。

最后,随着新模型的发布,Anthropic 还发布了系统卡,感兴趣的读者,可以前去阅读。

地址:https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf

大家也是期待新模型可以解决屎山问题。

不过,面对高昂的订阅费,大家也是吐槽:太贵,买不起。

「太吃token了。」

对了,在谷歌攒的 AI 国际象棋比赛第一天,Claude Opus 4 败给了 Gemini 2.5 Pro,不知 Claude Opus 4.1 要是参战的话,结局会不会改写。

本文来自微信公众号“机器之心”(ID:almosthuman2014),作者:关注AI的,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Anthropic Claude Opus 4.1 AI 模型
相关文章