智源社区 02月15日
Claude 4被曝发布在即!DeepSeek把大招都给逼出来了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

据透露,Anthropic公司计划在未来几周内发布其最新模型Claude 4。与以往模型不同,Claude 4采用混合型大模型设计,兼具推理能力和通用模型处理能力。这意味着它既能高效处理简单问题,又能运用更多算力解决复杂难题。用户还可以通过游标刻度尺调整token消耗,控制推理时长和成本。OpenAI也在探索类似方向,将通用模型和推理模型融合。Claude系列在编程能力方面一直处于领先地位,尤其擅长处理复杂的企业级编程任务。定价策略尚未公布,但市场竞争激烈,各模型玩家或将在价格上展开角逐。

💡Claude 4 采取混合型大模型设计,融合通用模型和推理模型,能够根据任务的复杂程度调整算力分配,在解决复杂问题时启用推理能力,处理简单问题时则使用通用模型,提高了效率和灵活性。

🕹️用户可以通过游标刻度尺调整 Claude 4 的推理成本,控制每个问题所需的 token 数量。将游标滑动到“0”时,模型表现为传统的 AI 大模型,数值越大,调用的算力越多,推理过程越长。这种设计让用户能够更好地控制使用成本。

💻 Claude 系列在编程能力方面一直处于领先地位,尤其擅长处理大厂工程师所需级别的编程任务。它能够理解由数千个文件组成的复杂代码库,并生成可正常运行的完整代码,且一次成功,这在其他 AI 大模型中并不常见。

终于!终于!Claude 4被曝将在未来几周内发布

高亮重点,最新的它采取了一个与之前模型路线不同的办法:

是个混合型大模型。

简单来说,就是既带有推理能力,会使用更多的算力来思考和解决难题;在面对简单问题的时候,又能像传统大模型一样短平快地轻巧处理,无需多费不必要的功夫。

怎么样,听起来是不是和昨天奥特曼透露的GPT-5非常类似(doge)

都是不再把传统通用模型和推理模型分开推出,直接融合在一起。

据透露,Anthropic计划在未来几周内发布该模型。

而翻遍互联网发现,4天前就有人按捺不住,在推特上剧透过:

Anthropic内部员工告诉我,他们将在本周内发布Claude 4,以及一个推理模型。
至于性能嘛,超过满血o3!

俗话说得好:传言有出入,期待需谨慎。

但还是禁不住狠狠期待一下!

下面一起来看更详细的剧透——

Claude 4不走老路,可控制使用时的推理成本

如前所述,Claude 4与此前的通用大模型不同。

把通用模型和推理模型融合到一起去了,会根据具体任务,调整所需算力和所需功能

遇到复杂的问题,就启用推理能力;遇到简单的问题,就用通用模型处理。

而且用户可以自行控制,每个问题需要耗费多少token——表现出来就是我可以规定它在每个具体的问题上思考推理多长时间。

具体操作,是使用者可以通过一个游标刻度尺来调整,刻度上标注的是“完成任务所需的token数”。

如果将游标滑动到“0”,那么Claude 4就是一个传统的、不带推理能力的AI大模型。

滑动到的数值越大,所调用的算力就越多,思考推理过程就越长。

其实呢,OpenAI现在的模型也有类似功能。

不过OpenAI只分了“低-中-高”三档,供用户选择推理强度。

但讲道理,很难预测模型在每一档位实际上会用掉多少tokens,所以很多用户反馈“三个档位并不能很好地控制使用成本”。

不过,这可能和OpenAI和Anthropic的市场定位有关系。

OpenAI更多针对的是普通用户和个人开发者,三档式更简单易懂,方便操作。

而Anthropic更注重企业级市场,相对来说toB一些,所以采用了游标刻度尺来调整,让使用者控制成本、速度等。

推理通用二合一,下一个大趋势?

可以看到,国外大模型的两个最强玩家,Anthropic和OpenAI,都明确了下一步道路:

让通用模型和推理模型合二为一。

几周内将发布的Claude 4如此,数月内将发布的GPT-5也是如此。

这或许是所有基座大模型玩家的下一步共同选择也未可知——

当传统Scaling Law撞墙成为一个强共识,而后训练、推理、CoT的重要性与日俱增时,推理变成通用模型的必需技能,似乎是大势所趋。

不过在这中间,Anthropic有属于自己的牢固生态位,那就是它旗下的Claude系列,编程能力一直站在第一梯队的顶尖

而且它擅长的是大厂工程师所需级别的编程任务。

举个例子,Claude系列更擅长理解由数千个文件组成的复杂代码库,并生成就能正常运行的完整代码,且一次成功。

这就非常有意思了~

因为在面对复杂编程问题时,AI大模型往往会偷懒,仅提供注释,而不是吐出实际代码。

不过,现在还不清楚Claude 4将如何定价。

会比o3-mini便宜吗?会比DeepSeek-R1便宜吗?会比Google 2.0 Flash-Lite便宜吗?

暂时还没人知道。

不过有网友说出了大多数人的心声:

如果花1000美元还解决不了我想解决的问题,那不是纯纯浪费钱吗。

说白了,如果不是在某项实用能力上有「傲视群雄的拔尖实力」,或许所有模型玩家在定价这一part上能做的,就是像DeepSeek和Google 2.0 Flash-Lite一样。

(忍痛)对着价格先狠狠砍一刀,然后再砍一刀,再砍一刀……

参考资料:
[1]
https://x.com/iruletheworldmo/status/1888978299159756878
[2]https://x.com/kimmonismus/status/1890056488774676697

评选报名2025年值得关注的AIGC企业&产品

下一个AI“国产之光”将会是谁?

本次评选结果将于4月中国AIGC产业峰会上公布,欢迎参与!

一键关注 ? 点亮星标

科技前沿进展每日见


一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

内容中包含的图片若涉及版权问题,请及时与我们联系删除

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Claude 4 混合模型 推理能力 编程能力
相关文章