原创 小可怜Gemini 2024-06-21 12:41 山东
Claude 3.5逆袭成为高考状元!昨天 Claude 偷偷搞事,发布了最新的 Claude-3.5-Sunnet,模型,我们紧急对该模型进行评测。
Claude 3.5逆袭成为高考状元!
昨天 Claude 偷偷搞事,发布了最新的 Claude-3.5-Sunnet,模型,我们紧急对该模型进行评测。
效果来看,以成绩69.9,领先 GPT-4-Turbo 接近一分!
一个字:强
两个字:炸裂
三个字:通通推到
我们看下更新后的 2024 年高考放榜成绩。
1、恭喜新同学claude-3-5-sonnet-20240620 率领 claude 家族复兴,已经不能用全村的希望来形容了,这是直接从学渣逆转到状元的励志故事!而且价格是榜眼 gpt-4-turbo 的三分之一,更恐怖的这只是 claude-3.5 的次级模型,旗舰 opus3.5 还没放出来。
2.sonnet 确实牛,不仅得分全场最高,答对的题里面两次作答的一致性也是全场最高
3.最后恭喜claude-3-5-sonnet,成为首个多模态全面领先文本模型。
其他模型完整的分析请查看原帖子:AI 高考及格率只有 33%!掀开 AI 的遮羞布一探究竟!
解读下该模型
从战略层面:
该模型对标的就是 GPT4o,通过不同的产品的价格定位、能力定位上,进一步抬高了接下来即将发布的 Claude-3.5-Opus,但是这招不是谁都能用了,咩有几分硬实力,谁敢这么出大气。
在定价上也充分的考虑 4o 的定价,维持原来的Claude-3-Sonnet 的定价不变。
为此还不惜拉扯老 Claude-3-Opus,性能一致,五分之一,四舍五入 = Opus 降价了!!!反正就是比 GPT4o 便宜,性能差不多。
这次能低调的放出该模型,说明 Claude母公司应该还有其他大牌,坐等 Opus 3.5 的发布。
接下来就看各位怎么继续卷,我只能再用力一点,不要停。
能力层面:首个多模态全面领先文本模型!
从文本模型 GPT-4,到视图模型GPT-4V,到融合多模态 Gemini-1.5,以及 GPT 4o,如果仔细观察,这是此时多模态全面领先文本模型。
在评测过程中的成绩也证明这这一点,包括
GPT-4-Turbo 在考试能力上水平获得第一,比GPT4o 的能力更强。
Claude-3.5-Sonnet 直接逆袭 GPT-4-Turbo,领先第一。
这意味着,GPT-4-Turbo 旧王当死,Claude3.5 教当立,该教没有教众,因为都被教主封完了。