Llama 3.3发布、 70B反超405B！Gemini新版再登大模型竞技场榜单

文章转载自「量子位」。

OpenAI“双12”刚进行到第二天，就把大模型圈搅得好不热闹！

一边是Meta没预告就发布了Llama 3.3，70B版本就能实现以前405B的性能。

另一边谷歌的Gemini也上线了新的实验版模型，再一次登上大模型竞技场榜首。

有网友感叹，o1、Llama 3.3和新版Gemini接连发布，马斯克的Grok3也要来，还有GPT-4.5初露端倪……这简直是最棒的一个圣诞季。

01 Llama 3.3：

70B实现405B效果

Llama 3.3目前只有70B一个型号。

但在指令遵循（IFEval）、数学（MATH）、推理（GPQA Diamond）等领域，水平都超过了七月份发布的Llama 3.1 405B。

在语言（MMLU）、代码（HumanEval）、长文本和多语种能力上，成绩也和Llama 3.1 405B比较接近。

而在工具使用（BFCL）上，和405B的差距则显得稍大一些。

不过，Llama 3.3的使用成本要比Llama 3.1 405B低得多。

虽然Llama本身是免费的，但是各个大模型平台的服务价格也可以作为衡量成本的一个参考。

在Meta合作的平台当中，Llama 3.3最便宜的价格是0.1/0.4美元每百万输入/输出Token。

而Llama 3.1 405B，则是1美元每百万输入token，是Llama 3.3的10倍，输出token为1.8美元，是Llama 3.3的4.5倍。

Meta生成式AI团队领导者Ahmad Al-Dahle表示，Llama 3.3能用70B实现405B的效果，主要是“运用了后训练技术的最新进展”，并点名其中包括在线偏好优化（online preference optimization）。

Meta AI官方账号也提到，Llama 3.3的进步归功于新的对齐过程和在线强化学习技术的进步。

目前，Llama 3.3的模型权重已在官网和Hugging Face上开放下载。

02 Gemini 迎来周岁生日

Gemini 1206上线的这天，刚好是Gemini的一周岁生日。

不过，从节奏和以日期命名的方式来看，Gemini更像是一次例行更新（上一个版本是1121）。

当然成绩还是很不错的，直接登上了lmsys大模型竞技场的榜首。

而且不只是总成绩夺冠，困难提示词、代码、数学、创意写作等各个单项排名也都是第一。

实际上，Gemini此前有个1114版本，也当了一周的“榜一大哥”，后来被更新的GPT-4o给比了下去。

现在的最新版本，又让Gemini重新回到了榜单上的王座。

此外，谷歌AI Studio产品负责人（原OpenAI开发者社区主管）Logan介绍，Gemini 1206拥有2百万token的上下文窗口，目前可通过谷歌AI Studio和Gemini API免费使用。

谷歌首席科学家Jeff Dean表示，取得这样的成绩是对Gemini生日最好的庆祝方式。

不过也有网友给谷歌泼了盆冷水，表示o1还没出现在这个榜单上，而且GPT-4.5就要来了，谷歌第一的位置恐怕很快又会被OpenAI夺走。

03 One More Thing

除了谷歌和Meta，马斯克xAI也被盛传即将发布Grok 3。

有网友发现，正在测试的Grok 2 mini消失了，认为这是要发Grok 3的征兆。

除了对Grok 3的猜测，还有一条更确定的消息——此前要充会员才能用的Grok，现在可以免费用了。

不过免费用户用量比较有限，每两小时只能处理10条消息，而图片分析一天只能处理三张。

有意思的是，我们试了试询问Grok自己，它也表示Grok 3计划在这个月上线。

但抓马的是，点进后面引用的消息源，发现这名博主也是问Grok之后发的帖子……

那么，在这个发布密集的十二月，你最钟意或者最期待哪一款产品呢？

参考链接：

[1]https://x.com/AIatMeta/status/1865079067390956006[2]https://x.com/Ahmad_Al_Dahle/status/1865071436630778109

[3]https://x.com/lmarena_ai/status/1865080944455225547

更多阅读

OpenAI发布季第一天：o1完全体，200美元/月的ChatGPT Pro

2024 SaaS年度观察：AI到底是「杀死」了SaaS，还是「改造」了SaaS？

万字探讨：如何成为一名 AI 产品经理？

对话flomo少楠：当然会对AI感到恐慌，但别着急

奇绩创坛2024秋季路演，这60个AI创业项目拿到钱了

全世界最懂大模型的两个产品经理，一起聊怎么做AI产品

转载原创文章请添加微信：founderparker

01

Llama 3.3：

70B实现405B效果

02

Gemini 迎来周岁生日

03

One More Thing

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签