10 万GPU烧出 AI 怪物，马斯克 Grok-3 硬刚 DeepSeek

“10 万张 H100 GPU 训练”、“证明黎曼猜想”、“最聪明的 AI”。

Grok-3 未发布就赚足了眼球，今天中午，一如既往的迟到后，被马斯克称为“Smartest AI on Earth”的 Grok-3 终于来到了我们面前。

注意，Grok-3 并不是一个对话助手，而是为了完成 xAI 的使命：“Our mission is to understand universe（我们的使命是了解宇宙）”

超越 GPT4o，最强 AI 初见端倪

这次发布会，马斯克发布了两套模型一个工具，即 Grok-3、Grok-3 Reasoning，以及 Agent 工具 Grok DeepSearch。

马斯克表示，Grok-3 在多项 Benchmark 的测试中均取得了比 DeepSeek-V3、GPT-4o、Gemini-2 Pro 更优的效果，Grok-3 已经在 xAI 内部运行了两个星期。

在现场演示中，工作人员用 Grok-3 寻找去火星的时间窗口，在一定程度上展示了 Grok-3 的信息搜索、真假信息判断以及推理能力。

另一个演示是制作一款融合俄罗斯方块和宝石迷阵的二合一游戏，展示了 Grok-3 的编程及创意能力。

从现场展示来看，Grok-3 的编程、推理、计算能力确实很突出。而在最新的 AIME 竞赛中也是断层领先。这里有亮点需要注意，第一个亮点是它这项对比的不是 V3 版本的 DeepSeek，而是最新的 DeepSeek R1；另一个亮点是 Grok-3 mini 的性能也非常突出。

在 Chatbot 竞技场之称的 LMSYS 盲测中，Grok 3 在代码、指令响应等各个方面排名第一。

如果说 ChatGPT 是学校里的模范生，那 Grok 就是试遍各种方法的取巧派。

在迪拜世界政府峰会上，马斯克表示，我们可以把人工智能看作一个超级天才的孩子，如果 AI 有好奇心并且追求真理，它将促进人类发展。

为了让这个“孩子”可以被更多人看到，半个小时左右的发布会上，马斯克拿出了五六分钟的时间来教大家如何在 X 平台上预约 Grok-3、推出不计算力的 SuperGrok、推荐大家使用网页版，以避免 App Store 审核导致的效果落后。

一周之后，语音版的 Grok 就会上线；几周之后，Grok-3 的 API 会上线；几个月之后，Grok-3 会开源，同时下一代 Grok 开始研发。

作为一个暂时闭源的模型，Grok 并没有太多限制，它不用和 DeepSeek 竞争、不用追求性价比，只要能打赢 OpenAI，它可以不计成本。

在发布会的结尾，Grok-3 非常激动地和大家用语音交流：我非常激动终于见到了你，我们终于可以互相学习了。

这如同赛博世界一般的宣言，也展示了马斯克的 AI 哲学：真实，好奇，热爱人类。

而这个可能是男性的声音，似乎也回答了 Q&A 阶段观众关于 Grok-3 性别的提问。

那对比 DeepSeek，谁更强呢？

与 Grok-3 重资产投入形成鲜明对比，DeepSeek R1 开源版本仅用了行业 1/50 的训练成本就实现了顶级性能，API 调用价格更是低至 0.001 元/千 Tokens，手机语音助手、国民应用微信等一众软件接入，让 DeepSeek 的“本土化场景”成为了几乎绝对的护城河。

有报道称，深圳福田区政务系统通过 DeepSeek 大模型，将办事流程压缩60%，微信 AI 搜索的灰度测试也显示，DeepSeek 在中文语义理解的准确性上超过了 Grok-2。

虽然我们现在还没有用到 Grok-3，但即便他更聪明，DeepSeek 也更懂中国市场的刚需。

同时就在今早，OpenAI 突然宣布开源，并在 X 平台发起投票，让用户选择更想开源哪个模型，如今短策模型投票大幅领先。而在月初，Altman 曾表示，OpenAI 闭源“站在了历史错误的一边”。

不论是希望通过 X 平台渗透到 C 端用户的 Grok-3，还是在金融、教育、制造等多个领域落地的 DeepSeek，还是宣布开源，即将发布 GPT-5 的 OpenAI。AI 行业即将进入技术与应用闭环反哺、互相促进的阶段。算力、人才、数据……竞争才刚刚开始。

本文来自微信公众号“PConline太平洋科技”，36氪经授权发布。