FishAI官方 1小时前
Claude 4:彻底炸了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Anthropic发布Claude Opus 4与Sonnet 4,标志着大模型从对话回答向长时段自主思考进化。Opus 4具备生成和调用“记忆文件”的能力,实现知识的“存→取→用”,使AI任务可跨时数日执行。模型可在思考中暂停,并行调用搜索、代码或文件系统,规划能力接近人类。Claude Code从研究预览转正,嵌入DevOps闭环,GitHub Copilot Coding Agent默认调用Sonnet 4,标志GitHub对OpenAI的依赖降低。Opus 4并非全能,Sonnet在代码领域更强,暗示细分模型优势。

🧠Claude Opus 4模型具备了“自己给自己留备忘录、再回头翻阅并继续任务”的能力。它允许本地文件读写,能主动生成“memory files”,把关键事实、路径选择、乃至游戏地图分段写入,再调用,从而突破上下文窗口的限制。

🛠️Claude Code从研究预览转正,配套VS Code / JetBrains 插件和 GitHub Actions。它不仅“生成代码”,还用 PR 留言与 CI 修复自动回环,真正嵌入 DevOps 闭环,将AI的角色由“对话助手”变为“代码流上的二号提交者”。

💡Opus 4与Sonnet 4各有侧重,Opus 4定位超长任务、极限推理与代码生成,而Sonnet 4则兼顾性价比与瞬时响应,特别是在代码领域表现更强,这表明细分模型在特定任务上可能更具优势。

原创 Sanlang 2025-05-23 02:48 意大利

Claude 4:彻底炸了,知识已接近尾声,而智力才是全部

 


一、一骑绝尘的孤独

Anthropic 今晚揭幕的 Claude Opus 4 与 Claude Sonnet 4,把大模型从「一次对话回答」推向「长时段、自主管理的思考实体」。从并行工具调用、可写可读的持久记忆、可挂起数小时的“扩展思考”——便会发现:

这些改动让 AI 第一次具备了“自己给自己留备忘录、再回头翻阅并继续任务”的能力。

这一能力,也许比任何单项基准分数都更具箭头意义,兄弟们,AI 越来越像个人了,会自己整理知识,会并行的使用与反思进展!人类距离下岗还有多久!!

二、Code、Code、Code

不得不表扬,Claude 系列在 Coding 上持续有效的投入,本次发布在Coding 上又有新的提,而且不仅仅是代码层面的提升,而是整体生态的突破:

三、上不去的跑分,得上去的智商

有意思的是Opus 并不是在任何领域都强于 Sonnet,反而在代码领域 Sonnet 更强一些,这信息其实很有意思,至少能说明几个事情:

四、其他汇总

维度

Opus 4

Sonnet 4

共同新特性

定位

超长任务、极限推理与代码生成的旗舰

性价比与瞬时响应兼顾的中坚

双模式:瞬时回答 / 扩展思考

代码基准

SWE-bench 72.5%、Terminal-bench 43.2%,居业界首位

SWE-bench 72.7%,刷新中档模型纪录

并行工具调用;可写入本地“记忆文件”

安全等级

首批触发 Anthropic ASL-3 风险管控的模型,启动更严密的越狱防护与安全赏金

同步继承

65% ↓ “走捷径”倾向;思维摘要仅在 5 % 长链条场景触发

价格

$15 / $75 每百万 tokens(入/出)

$3 / $15

旧价续用,API、Bedrock、Vertex AI 同步上架

 

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Claude 4 人工智能 大模型 代码生成 智力
相关文章