马斯克甩出Grok3，“地表最强大模型”成色几何？

与AI同行的 2025-02-18 19:02 北京

AI竞赛愈演愈烈

DeepSeek搅动的全球大模型竞争愈演愈烈。

近期，OpenAI频频发声，预告GPT-4.5、GPT-5新进展。马斯克旗下的xAI索性抛出新模型，今日（2月18日）发布最新版Grok 3聊天机器人，称该模型测试版推理能力超过所有AI模型。

这款新模型成色几何？本期「云启科技π」带你一起了解。

本文转载自“腾讯科技”

原标题《马斯克狂吹的Grok 3，终于发布了》

金鹿腾讯科技特约编译

2月18日消息，埃隆·马斯克旗下的人工智能初创公司xAI发布最新版Grok 3聊天机器人，同OpenAI和DeepSeek等大模型展开新一轮竞争。马斯克曾多次将Grok 3描述为“地球上最聪明的人工智能”，在上线之前便引起了业界的广泛关注。

马斯克表示，Grok 3首先面向X的Premium Plus 订阅用户开放，他们将作为首批体验者。此外，xAI还为忠实粉丝推出了名为Super Grok的独立订阅服务，提供最先进的功能和最早的新特性访问权限。

xAI表示，Grok 3的预训练已经完成，整个团队一直在积极地将推理能力整合到当前的Grok 3模型中。然而，这种集成仍处于早期阶段，需要更多的改进。Grok 3目前正在继续接受训练。

除了Grok 3推理模型外，xAI还在训练一个该推理模型的迷你版。可以将Grok 3的推理数据与迷你推理模型进行对比，有时其后者的表现甚至会略微优于Grok 3推理模型。

号称性能超越

DeepSeek和ChatGPT

在发布会上，马斯克表示，xAI 之所以将其聊天机器人命名为Grok，是因为这个词源自美国科幻作家罗伯特·海因莱因的小说《异乡异客》（Stranger in a Strange Land）。在书中，“Grok” 由一位在火星上长大的角色使用，意指对某事物全面且深刻的理解。

马斯克和他的人工智能团队声称，Grok 3测试版的推理能力超过了现有的人工智能模型。在有关推理和测试时间的基准测试中，Grok 3取得了比DeepSeek-R1、OpenAI o1、OpenAI o3 mini- high、Gemini-2 Flash Thinking更优的效果。

根据xAI的比较基准显示，Grok 3在科学、编码和数学方面的得分高于Gemini 2 Pro、Deepseek V3、ChatGPT 4o等。并且，在盲测方面，xAI的Grok-3（早期版本）在 lmArena 排行榜中以1402 分的历史最高成绩登顶，成为首个突破1400分的AI模型。这一成绩超越了Google、OpenAI、DeepSeek等业界主要竞品。

122天打造AI超算中心，

使其性能翻倍

在演示过程中，马斯克和xAI的几位高管分享了他们如何构建Grok。马斯克透露，由于xAI希望尽快推出Grok 3，时间非常紧迫。因此，他们意识到必须在短短四个月内建成数据中心。

xAI表示，他们花了122天让首批10万颗GPU上线并运行，这是目前全球最大的全连接H100集群。随后，xAI进一步加速扩建数据中心，仅用92天便完成第二阶段建设，使计算能力再次翻倍（依此计算约有20万块GPU）。

xAI团队还展示了Grok 3如何执行有趣的任务。例如计算从地球到火星的航天器任务。Grok 3 生成了一张太空发射的动画 3D 轨迹图（即从地球到火星然后再返回地球的可行轨迹）。这涉及一些复杂的物理知识，Grok 3需要理解这些内容。

Grok 3还展示了在自动化游戏开发方面的潜力。xAI团队要求Grok 3现场创造一款融合《俄罗斯方块》和《宝石迷阵》的新游戏。Grok 3生成的Python脚本定义了游戏的常量、颜色、方块形状等元素，并呈现出独特玩法：当连接了至少三个相同颜色的方块时，会触发重力机制使方块消除，这种方式类似《宝石迷阵》。

此外，Grok 3包含一个名为Big Brain的功能，这是一个推理模型模式，允许在处理查询时进行更深入的思考。马斯克指出，17个月前，最初的Grok模型几乎不能解决高中问题，而现在它已经进步了很多，他幽默地比喻“Grok已经准备好上大学了”。

开发深度搜索功能、

考虑开源Grok 2

除了推出 Grok 3 之外，xAI 还透露，该公司正在筹建一家人工智能游戏工作室，该工作室将专注于为消费者提供服务。

此外，xAI正在为Grok开发深度搜索功能（DeepSearch）。这将成为其AI智能体的核心能力之一。DeepSearch是一款推理聊天机器人，能够阐述其理解查询内容的过程以及规划回复的方式。演示显示，DeepSearch具有研究、头脑风暴和数据分析等功能。马斯克团队还表示，他们打算“尽快”推出一款基于语音的聊天机器人。

对于Grok 3是否会开源，马斯克表示，“我们通常会在新模型发布的时候，开源上一代模型，所以几个月后，我们也会对Grok 2进行开源。”

随着Grok-3不断刷新纪录，人工智能竞赛正加速升温。xAI通过强化推理能力、构建超大算力集群，并在游戏等应用领域进行实验性探索，正快速跻身DeepSeek、ChatGPT 等头部大模型的竞争行列。Grok-3 的持续迭代表明，AI竞赛不仅未见终点，反而正在进入更激烈的阶段。

阅读原文

跳转微信打开

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签