Cnbeta 04月06日 04:39
<span style="color:#c00000;">Meta 发布新一代旗舰 AI 模型 Llama 4</span>
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Meta 推出了其 Llama 4 系列 AI 模型,包括 Scout、Maverick 和 Behemoth,旨在增强其 AI 助手 Meta AI 的功能。这些模型通过大量数据训练,具备广泛的视觉理解能力。Llama 4 采用了混合专家 (MoE) 架构,提高了计算效率。新模型在编码、推理、多语言等基准测试中表现出色,尤其是在处理长文档和摘要任务上。Meta 改进了 Llama 4 的响应能力,使其能够回答更多问题,并回应各种观点,减少了对“有争议”问题的拒绝。然而,欧盟用户和公司在使用和分发这些模型时受到限制,且大型公司需申请特殊许可。

🚀 Meta 发布 Llama 4 系列,包括 Scout、Maverick 和 Behemoth 三个模型。这些模型经过大量数据训练,具备广泛的视觉理解能力,并已应用于 Meta AI 助手,提升其在 40 个国家/地区的服务能力。

💡 Llama 4 采用了混合专家 (MoE) 架构,提高了计算效率。其中,Maverick 模型在编码、推理、多语言等多个基准测试中表现出色,适合用于一般助理和聊天场景;而 Scout 模型擅长文档摘要和大型代码库推理,其独特的优势在于拥有 1000 万个标记的超大上下文窗口。

⚖️ Meta 调整了 Llama 4 模型,使其不再频繁拒绝回答“有争议”的问题,并提高了其响应能力,能够回应各种观点。这一调整是在人工智能偏见问题引发讨论的背景下进行的,旨在提供更全面和客观的回答。

⚠️ Llama 4 的使用受到一些限制。欧盟用户和公司在使用和分发这些模型时受到限制,大型公司需要申请特殊许可。这反映了对人工智能和数据隐私的治理要求。

Meta于周六发布了其 Llama 家族的全新 AI 模型系列Llama 4。总共有四种新模型:Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。Meta 表示,所有模型都经过“大量未标记的文本、图像和视频数据”的训练,从而获得“广泛的视觉理解”。

中国DeepSeek的开放模型取得了成功,其性能与 Meta 之前的旗舰 Llama 模型相当甚至更好,这推动了 Llama 的加速开发。据说 Meta 已经组建了作战室来解密 DeepSeek 如何降低运行和部署R1和V3等模型的成本。

Scout 和 Maverick 已在Llama.com和 Meta 的合作伙伴处公开提供,包括 AI 开发平台 Hugging Face,而 Behemoth 仍在训练中。Meta 表示,其跨 WhatsApp、Messenger 和 Instagram 等应用的 AI 助手 Meta AI 已更新,可在 40 个国家/地区使用 Llama 4。目前,多模式功能仅限于美国英语版本。

一些开发人员可能对 Llama 4 许可证提出异议。

禁止在欧盟“注册”或“主要营业地点”为欧盟的用户和公司使用或分发这些模型,这可能是该地区人工智能和数据隐私法规定的治理要求的结果。(过去,Meta 曾谴责这些法律过于繁琐。)此外,与之前的 Llama 版本一样,每月活跃用户超过 7 亿的公司必须向 Meta 申请特殊许可,Meta 可自行决定授予或拒绝该许可。

Meta在一篇博文中写道: “这些 Llama 4 模型标志着 Llama 生态系统新时代的开始。这只是 Llama 4 系列的开始。”

Meta 表示,Llama 4 是其第一批使用混合专家 (MoE) 架构的模型,该架构在训练和回答查询方面具有更高的计算效率。MoE 架构基本上将数据处理任务分解为子任务,然后将其委托给较小的、专门的“专家”模型。 

例如,Maverick 总共拥有 4000 亿个参数,但在 128 位“专家”中只有 170 亿个活跃参数。(参数大致对应于模型的解决问题的能力。)Scout 拥有 170 亿个活跃参数、16 位专家和 1090 亿个总参数。

根据 Meta 的内部测试,Maverick 在某些编码、推理、多语言、长上下文和图像基准上超过了 OpenAI 的GPT-4o和Google的Gemini 2.0等模型,该公司称 Maverick最适合创意写作等“一般助理和聊天”用例。然而,Maverick 还不如Google的Gemini 2.5 Pro、Anthropic 的Claude 3.7 Sonnet和 OpenAI 的GPT-4.5等功能更强大的近期模型。

Scout 的优势在于文档摘要和大型代码库推理等任务。它的独特之处在于拥有非常大的上下文窗口:1000 万个标记。(“标记”代表原始文本的片段 — 例如,“fantastic” 一词可拆分为“fan”、“tas”和“tic”。)用简单的英语来说,Scout 可以接收图像和多达数百万个单词,从而能够处理和处理非常长的文档。

据 Meta 称,Scout 可以在单个 NVIDIA H100 GPU 上运行,而 Maverick 则需要 NVIDIA H100 DGX 系统。

Meta 尚未发布的 Behemoth 将需要更强大的硬件。据该公司称,Behemoth 拥有 2880 亿个活跃参数、16 位专家和近 2 万亿个总参数。Meta 的内部基准测试显示,在多项衡量 STEM 技能(如数学问题解决能力)的评估中,Behemoth 的表现优于 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro(但不是 2.5 Pro)。

值得注意的是,Llama 4 模型中没有一个是像 OpenAI 的o1和o3-mini那样的真正的“推理”模型。推理模型会核实其答案,并且通常能更可靠地回答问题,但因此比传统的“非推理”模型需要更长的时间来给出答案。

有趣的是,Meta 表示,它对所有 Llama 4 型号进行了调整,使其不再频繁地拒绝回答“有争议”的问题。据该公司称,Llama 4 会回应“有争议的”政治和社会话题,而之前的 Llama 型号不会回应。此外,该公司表示,Llama 4 的“平衡性大大提高”,它根本不会接受这些提示。

Meta 发言人表示:“你可以依靠 Lllama 4 提供有用的、基于事实的回答,而不会做出任何评判。我们正在继续提高 Llama 的响应能力,以便它能够回答更多问题,能够回应各种不同的观点,并且不会偏袒某些观点。”

这些调整是在白宫的一些盟友指责人工智能聊天机器人在政治上过于“觉醒”之际做出的。

唐纳德·特朗普总统的许多密友,包括亿万富翁埃隆·马斯克和加密与人工智能“沙皇”大卫·萨克斯,都声称流行的人工智能聊天机器人 会审查保守派观点。萨克斯曾指出,  OpenAI 的 ChatGPT 是“被编程为唤醒”的,并且在政治话题上不诚实。

事实上,人工智能中的偏见是一个棘手的技术问题。马斯克自己的人工智能公司 xAI 一直在 努力 打造一款不会偏袒某些政治观点的聊天机器人。

这并没有阻止包括 OpenAI 在内的公司调整他们的人工智能模型来回答比以前更多的问题,特别是涉及有争议话题的问题。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Llama 4 Meta 人工智能模型 AI助手
相关文章