速递｜马斯克xAI未按时发布新模型，传统AI训练方法面临瓶颈？

TechCrunch 2025-01-03 11:08 北京

尽管如此，推迟的发布时间框架增加了传统 AI 训练方法面临瓶颈的证据。

图片来源：xAI

错过承诺发布时间的旗舰 AI 模型列表继续增加。

去年夏天，亿万富翁埃隆·马斯克，人工智能公司 xAI 的创始人兼首席执行官，表示 xAI 的下一个主要人工智能模型 Grok 3 将在 2024 年“年底”推出。Grok 是 xAI 对 OpenAI 的 GPT-4o 和谷歌的 Gemini 等模型的回应，能够分析图像并回答问题，并为马斯克的社交网络 X 上的多个功能提供支持。

“Grok 3 在经过 100k H100s 的训练后，年末应该会非常特别，”马斯克在 7 月的一篇 X 帖子中写道，指的是 xAI 位于孟菲斯的大型 GPU 集群。“Grok 3 将是一个重大飞跃，”他在 12 月中旬的后续帖子中说道。

然而今天是 1 月 2 日，Grok 3 还没有到达——也没有迹象表明它的推出即将到来。

事实上，AI 提示者 Tibor Blaho 在 xAI 网站上发现的一些代码表明，一个中间模型“Grok 2.5”可能会首先推出。

诚然，这并不是马斯克第一次设定一个宏伟目标并未能实现。众所周知，马斯克关于产品发布时机的声明往往充其量是不切实际的。

公平地说，在八月份与播客主持人莱克斯·弗里德曼的采访中，马斯克表示，Grok 3“希望”在 2024 年“如果我们幸运的话”可用。

但 Grok 3 的 MIA 状态很有趣，因为它是一个日益增长的趋势的一部分。

去年，人工智能初创公司 Anthropic 未能推出其顶级 Claude 3 Opus 模型的继任者。在宣布下一代模型 Claude 3.5 Opus 将在 2024 年底之前发布几个月后，Anthropic 将该模型的所有提及从其开发者文档中删除。（根据一份报告，Anthropic 确实在去年某个时候完成了 Claude 3.5 Opus 的训练，但决定发布它没有经济意义。）

据报道，谷歌和 OpenAI 在最近几个月也遭遇了其旗舰模型的挫折。

这可能是当前人工智能 Scaling Law局限性的证据——公司用来提高其模型能力的方法。在不久前，通过使用大量计算能力和越来越大的数据集来训练模型，可以实现显著的性能提升。但每一代模型的增益已经开始缩小，这导致公司寻求替代技术。

马斯克本人在弗里德曼的采访中提到了这一点。

“你希望[Grok 3]成为最先进的吗？”弗里德曼问。

“希望如此，”马斯克回答。“我的意思是，这就是目标。我们可能会在这个目标上失败。这是我们的愿望。”

Grok 3 延迟可能还有其他原因。xAI 的团队规模远小于许多竞争对手。尽管如此，推迟的发布时间框架增加了传统 AI 训练方法面临瓶颈的证据。

本文翻译：https://techcrunch.com/2025/01/02/xais-next-gen-grok-model-didnt-arrive-on-time-adding-to-a-trend/

编译：ChatGPT

-----------END-----------

? 我们正在招募新一期的实习生