未知数据源 2024年06月21日
GPT4 痛失高考状元席位,Claude逆势突袭第一
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

原创 小可怜Gemini 2024-06-21 12:41 山东

Claude 3.5逆袭成为高考状元!昨天 Claude 偷偷搞事,发布了最新的 Claude-3.5-Sunnet,模型,我们紧急对该模型进行评测。

Claude 3.5逆袭成为高考状元!

昨天 Claude 偷偷搞事,发布了最新的 Claude-3.5-Sunnet,模型,我们紧急对该模型进行评测。

效果来看,以成绩69.9,领先 GPT-4-Turbo 接近一分!

一个字:强

两个字:炸裂

三个字:通通推到

我们看下更新后的 2024 年高考放榜成绩。


1、恭喜新同学claude-3-5-sonnet-20240620 率领 claude 家族复兴,已经不能用全村的希望来形容了,这是直接从学渣逆转到状元的励志故事!而且价格是榜眼 gpt-4-turbo 的三分之一,更恐怖的这只是 claude-3.5 的次级模型,旗舰 opus3.5 还没放出来。

2.sonnet 确实牛,不仅得分全场最高,答对的题里面两次作答的一致性也是全场最高

3.最后恭喜claude-3-5-sonnet,成为首个多模态全面领先文本模型。

其他模型完整的分析请查看原帖子:AI 高考及格率只有 33%!掀开 AI 的遮羞布一探究竟!

解读下该模型

从战略层面:

该模型对标的就是 GPT4o,通过不同的产品的价格定位、能力定位上,进一步抬高了接下来即将发布的 Claude-3.5-Opus,但是这招不是谁都能用了,咩有几分硬实力,谁敢这么出大气。

在定价上也充分的考虑 4o 的定价,维持原来的Claude-3-Sonnet 的定价不变。

为此还不惜拉扯老 Claude-3-Opus,性能一致,五分之一,四舍五入 = Opus 降价了!!!反正就是比 GPT4o 便宜,性能差不多。

这次能低调的放出该模型,说明 Claude母公司应该还有其他大牌,坐等 Opus 3.5 的发布。

接下来就看各位怎么继续卷,我只能再用力一点,不要停。

能力层面:首个多模态全面领先文本模型!

从文本模型 GPT-4,到视图模型GPT-4V,到融合多模态 Gemini-1.5,以及 GPT 4o,如果仔细观察,这是此时多模态全面领先文本模型。

在评测过程中的成绩也证明这这一点,包括

    GPT-4-Turbo 在考试能力上水平获得第一,比GPT4o 的能力更强。

    Claude-3.5-Sonnet 直接逆袭 GPT-4-Turbo,领先第一。

这意味着,GPT-4-Turbo 旧王当死,Claude3.5 教当立,该教没有教众,因为都被教主封完了。










Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

相关文章