Z Potentials 04月09日
速递|Meta发布Llama 4,首批采用混合专家模型,但非真正的推理模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Meta推出了新一代AI模型Llama 4,包括Scout、Maverick和Behemoth。这些模型在大量数据上训练,具备广泛的视觉理解能力。Llama 4采用了专家混合(MoE)架构,提高了计算效率。Maverick在通用助手和聊天场景中表现出色,部分测试超越了GPT-4o和Gemini 2.0。Scout则擅长文档摘要和大型代码库推理,拥有极大的上下文窗口。Behemoth在多个评估中超越了GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro。尽管如此,Llama 4并非真正的“推理”模型,但标志着Llama生态系统的新时代。

🚀 Meta发布了Llama 4系列AI模型,包括Scout、Maverick和Behemoth,这些模型在大量数据上训练,具备广泛的视觉理解能力。

💡 Llama 4采用了专家混合(MoE)架构,通过将任务分解给专门的“专家”模型,提高了计算效率。例如,Maverick有4000亿个总参数,但只有170亿个活跃参数。

🔥 Maverick在通用助手和聊天场景中表现出色,部分测试中超越了GPT-4o和Gemini 2.0。Scout擅长文档摘要和大型代码库推理,拥有1000万个标记的上下文窗口,可以处理极长的文档。

⚠️ Behemoth在多个评估中超越了GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro,但值得注意的是,Llama 4的所有模型都不是真正的“推理”模型。

TechCrunch 2025-04-06 12:55 北京

但非真正“推理”模型

图片来源:Meta

Meta 已经发布了一系列新的 AI 模型 ,Llama 4,属于其 Llama 家族——而且还是在一个星期六。

总共有四个新模型:Llama 4 ScoutLlama 4 Maverick 和 Llama 4 BehemothMeta 表示,所有模型都是在“大量未标记的文本、图像和视频数据”上进行训练的,以赋予它们“广泛的视觉理解”。

来自中国人工智能实验室 DeepSeek 开源模型的成功, 使 Llama 的开发进入了加速阶段,这些模型的表现与 Meta 之前的旗舰 Llama 模型相当或更好。Meta 据说已经紧急成立战情室,以解读 DeepSeek 如何降低运行和部署像 R1 和 V3 这样的模型的成本。

Scout 和 Maverick 可以在 Llama.com 和 Meta 的合作伙伴处公开获取,而 Behemoth 仍在训练中。Meta 表示,其跨应用程序(包括 WhatsAppMessenger 和 Instagram)的 AI 助手 Meta AI 已在 40 个国家进行了更新,以使用 Llama 4。目前,多模态功能仅限于美国的英语用户。

一些开发者可能会对 Llama 4 的许可证提出异议。

在欧盟“注册”或有“主要营业地点”的用户和公司被禁止使用或分发这些模型 ,这可能是该地区的人工智能和数据隐私法律所施加的治理要求的结果。(过去,Meta 曾批评这些法律过于繁重。)此外,与之前的 Llama 发布一样,拥有超过 亿月活跃用户的公司必须向 Meta 申请特别许可,Meta 可以自行决定是否授予该许可。

“这些 Llama 4 模型标志着 Llama 生态系统新时代的开始,”Meta 在博客文章中写道 。“这只是 Llama 4 系列的开始。”

Meta 表示,Llama 4 是其首批采用专家混合(MoE)架构的模型,这种架构在训练和回答查询时更具计算效率。MoE 架构基本上将数据处理任务分解为子任务,然后将其委派给更小的、专门的“专家”模型。

例如,Maverick 拥有 4000 亿个总参数,但只有 170 亿个活跃参数,分布在 128 个“专家”中。(参数大致对应于模型的解决问题能力。)Scout 拥有 170 亿个活跃参数,16 个专家和 1090 亿个总参数。

根据 Meta 的内部测试,该公司表示,Maverick 最适合用于“通用助手和聊天”的场景,如创意写作,在某些编码、推理、多语言、长上下文和图像基准测试中超越了 OpenAI 的 GPT-4o 和 Google 的 Gemini 2.0然而,Maverick 在能力上仍不及一些更强大的新模型,如 Google 的 Gemini 2.5 ProAnthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4.5

Scout 的优势在于文档摘要和对大型代码库的推理等任务。独特的是,它具有非常大的上下文窗口:1000 万个标记。(“标记”表示原始文本的片段——例如,单词“fantastic”被拆分为“fan”、“tas”和“tic。”)用简单的英语来说,Scout 可以处理图像和多达数百万个单词,使其能够处理和处理极长的文档。

根据 Meta 的计算,Scout 可以在单个 Nvidia H100 GPU 上运行,而 Maverick 则需要 Nvidia H100 DGX 系统或同等设备。

Meta 尚未发布的 Behemoth 将需要更强大的硬件。根据该公司的说法,Behemoth 拥有 2880 亿个活跃参数、16 个专家和近 万亿个总参数。Meta 的内部基准测试显示,Behemoth 在多个评估中超越了 GPT-4.5Claude 3.7 Sonnet 和 Gemini 2.0 Pro(但不包括 2.5 Pro),这些评估测量了 STEM 技能,如数学问题解决能力。

值得注意的是,Llama 4 的所有模型都不是像 OpenAI 的 o1 和 o3-mini 那样的真正“推理”模型。推理模型会对其答案进行事实核查,并通常更可靠地回答问题,但因此交付答案的时间比传统的“非推理”模型要长。

图片来源:Meta

本文翻译自:https://techcrunch.com/2025/04/05/meta-releases-llama-4-a-new-crop-of-flagship-ai-models/

编译:ChatGPT

-----------END-----------
🚀 我们正在招募新一期的实习生
🚀 我们正在寻找有创造力的00后创业
关于Z Potentials

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Llama 4 Meta AI模型 MoE架构 人工智能
相关文章