TechCrunch 2025-01-03 11:08 北京
尽管如此,推迟的发布时间框架增加了传统 AI 训练方法面临瓶颈的证据。
图片来源:xAI
错过承诺发布时间的旗舰 AI 模型列表继续增加。
去年夏天,亿万富翁埃隆·马斯克,人工智能公司 xAI 的创始人兼首席执行官,表示 xAI 的下一个主要人工智能模型 Grok 3 将在 2024 年“年底”推出。Grok 是 xAI 对 OpenAI 的 GPT-4o 和谷歌的 Gemini 等模型的回应,能够分析图像并回答问题,并为马斯克的社交网络 X 上的多个功能提供支持。
“Grok 3 在经过 100k H100s 的训练后,年末应该会非常特别,”马斯克在 7 月的一篇 X 帖子中写道,指的是 xAI 位于孟菲斯的大型 GPU 集群。“Grok 3 将是一个重大飞跃,”他在 12 月中旬的后续帖子中说道。
然而今天是 1 月 2 日,Grok 3 还没有到达——也没有迹象表明它的推出即将到来。
事实上,AI 提示者 Tibor Blaho 在 xAI 网站上发现的一些代码表明,一个中间模型“Grok 2.5”可能会首先推出。
诚然,这并不是马斯克第一次设定一个宏伟目标并未能实现。众所周知,马斯克关于产品发布时机的声明往往充其量是不切实际的。
公平地说,在八月份与播客主持人莱克斯·弗里德曼的采访中,马斯克表示,Grok 3“希望”在 2024 年“如果我们幸运的话”可用。
但 Grok 3 的 MIA 状态很有趣,因为它是一个日益增长的趋势的一部分。
去年,人工智能初创公司 Anthropic 未能推出其顶级 Claude 3 Opus 模型的继任者。在宣布下一代模型 Claude 3.5 Opus 将在 2024 年底之前发布几个月后,Anthropic 将该模型的所有提及从其开发者文档中删除。(根据一份报告,Anthropic 确实在去年某个时候完成了 Claude 3.5 Opus 的训练,但决定发布它没有经济意义。)
据报道,谷歌和 OpenAI 在最近几个月也遭遇了其旗舰模型的挫折。
这可能是当前人工智能 Scaling Law局限性的证据——公司用来提高其模型能力的方法。在不久前,通过使用大量计算能力和越来越大的数据集来训练模型,可以实现显著的性能提升。但每一代模型的增益已经开始缩小,这导致公司寻求替代技术。
马斯克本人在弗里德曼的采访中提到了这一点。
“你希望[Grok 3]成为最先进的吗?”弗里德曼问。
“希望如此,”马斯克回答。“我的意思是,这就是目标。我们可能会在这个目标上失败。这是我们的愿望。”
Grok 3 延迟可能还有其他原因。xAI 的团队规模远小于许多竞争对手。尽管如此,推迟的发布时间框架增加了传统 AI 训练方法面临瓶颈的证据。
本文翻译:https://techcrunch.com/2025/01/02/xais-next-gen-grok-model-didnt-arrive-on-time-adding-to-a-trend/
编译:ChatGPT
-----------END-----------
? 我们正在招募新一期的实习生
? 我们正在寻找有创造力的00后创业者
关于Z Potentials