智源社区 05月20日 12:32
Llama 4万亿巨兽延期,80%核心元老集体辞职?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Meta的AI战略似乎正面临挑战。旗舰AI模型Behemoth的发布一再推迟,引发内部对公司数十亿美元AI投入的质疑。Llama 1初始团队已有11人离职,新模型Llama 4的表现也未能达到预期,甚至被质疑刷榜。面对OpenAI和谷歌等竞争对手的快速发展,Meta正积极招募人才,试图带领Llama 5团队迎头赶上。然而,整个AI行业似乎都面临着Scaling Law的瓶颈,顶级AI公司在下一代模型的开发中都遇到了困难。

🔥Meta旗舰AI模型Behemoth发布时间一再延期,原因是模型性能未达预期,内部对AI产品团队的表现感到失望,甚至考虑进行重大调整。

📉Llama 1 初始团队中已有11人从Meta离职,引发了人们对Meta AI研发方向的担忧。新一代Llama模型Llama 4,在LMArena上被质疑刷榜,真实排名大幅下降,进一步加剧了Meta的困境。

🔍Meta正在积极招募AI人才,包括Llama 5团队的负责人。同时,Meta也面临着技术问题,有用户在使用Meta AI测试Llama 4时,遇到了模型拒绝回复以及登录失败等问题。

🚧整个AI行业似乎都面临着Scaling Law的瓶颈,OpenAI的GPT-5和Anthropic的Claude 3.5 Opus等模型也迟迟未能发布。这表明AI模型的未来发展可能比过去慢得多,且成本高昂。

编辑:桃子

Llama 4团队约80%的人集体辞职?

昨天,来自AI明星初创Prime Intellect的机器学习研究员一则惊天爆料,彻底点燃了AI圈。

就连WSJ几天前的独家报道,也被人们翻了出来。

文章称,Meta旗舰AI模型「Behemoth」一再推迟发布,内部对公司数十亿美元AI战略的质疑达到顶峰。

而且,文中还给出了更多人员流失的细节:

Llama 1初始团队中,原来14人中已有11人从Meta离职。

对此,Meta高管Dave Arnold立即辟谣,80%员工逃离的消息不准确。他还特别强调,这些离职的仅是发表Llama 1团队的人,并非后续的团队。

与此同时,OpenAI昨日上线了超强编码智能体Codex。下周,谷歌I/O大会上还将发布Veo、Flow等一系列爆款。

这场风波,让行业不禁发出灵魂拷问:Meta在这场AI竞赛中,是否已陷入瓶颈?


2万亿巨兽「滑铁卢」


按照原计划,Meta会在4月首届AI开发者大会上,正式上线2万亿参数Behemoth。

当时,知情人士表示,由于模型性能未达预期,发布时间被推迟至6月。

如今,将会延至到今年秋季,甚至更晚。

Llama 4发布当天,Meta曾首次介绍了这款模型,仍在训练中。

它是Maverick协同蒸馏的教师模型,使用30T多模态token在32K个GPU上进行预训练(FP8)。

Behemoth是Meta大模型与OpenAI、谷歌、Anthropic等抗衡的重要武器。

然而,工程师们在提升其性能方面遇到困难,内部甚至质疑其改进是否足以支撑公开发布。

甚至,Behemoth的开发困境让高管们,对Llama 4开发团队的表现感到失望。

在内部,他们正考虑对AI产品团队进行重大优化调整。


Meta慌了,招募AI大佬带队Llama 5?


Meta的AI之路并非一帆风顺。

其首款Llama模型,曾由AI研究团队(FAIR)开发。该团队以学术研究为主,成员大多是博士。

2023年初,Llama 1及相关论文发布后,在业界赢得了广泛的好评。

论文地址:https://arxiv.org/pdf/2302.13971

然而,自那以后,原始论文的14名研究者中有11人已离开公司,新一代Llama模型由另一团队接手。

今年,Meta还计划投资高达720亿美元,大部分用于AI的研发、基础设施投入。

然而,上个月,Llama 4模型的上线,却让人们大失所望。因其在LMArena上,用了非公开版模型去刷榜,模型排名冲到TOP 3。

一时间,全网质疑Meta造假声愈演愈烈。最后,LMSYS决定重新评估,结果Llama 4真实排名跌倒了30开外。

在所有对手快速迭代的强压之下,Meta实属慌了。

Hyperbolic联创兼CTO Yuchen Jin称,自己收到了Meta招募信息——带领Llama 5团队。

另一张来自@kalomaze截图显示,Meta发出多个英雄帖,在美国不同地区大量招募软件工程师。

几天前,Yuchen Jin用Meta AI测试Llama 4后,体验感极差。

截图后让模型去理解图片内容,但Meta AI拒绝了回复。当他去登录账号时,也失败了。

他直言道,「这不仅仅是Llama 4的问题,而是Meta的技术问题」。


Scaling Law又一次撞墙?


Meta当下的困境并非个例。

当前,其他顶级AI公司同样在下一代模型的开发中遇到了瓶颈。

先拿OpenAI来说吧,他们原计划于2024年中发布GPT-5,至今仍未推出,最新版本仅为GPT-4.5。

不过,在昨天AMA Reddit在线问中,OpenAI副总裁透露,多个产品整合到GPT-5中。而且,据称,GPT-5将完全基于尚未发布的模型构建。

另外,Anthropic Claude 3.5 Opus模型自去年宣布以来,至今未发布,对外仅表示「即将推出」。

纽约大学数据科学中心助理教授Ravid Shwartz-Ziv指出,「目前,所有实验室和模型的进步都相当有限」。

这一现象表明,AI模型的未来发展可能比过去慢得多,且成本高昂。

尽管Behemoth的发布一再推迟,Meta仍有可能选择提前推出一个功能有限的版本,以缓解外部压力。

参考资料:
https://x.com/kalomaze/status/1923431110962204680
https://www.wsj.com/tech/ai/meta-is-delaying-the-rollout-of-its-flagship-ai-model-f4b105f7?mod=hp_lead_pos1
https://x.com/Yuchenj_UW/status/1922696849741447421
https://x.com/Yuchenj_UW/status/1923490648256282709


内容中包含的图片若涉及版权问题,请及时与我们联系删除

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Meta AI Llama Behemoth Scaling Law
相关文章