与AI同行的 2025-02-18 19:02 北京
AI竞赛愈演愈烈
DeepSeek搅动的全球大模型竞争愈演愈烈。
近期,OpenAI频频发声,预告GPT-4.5、GPT-5新进展。马斯克旗下的xAI索性抛出新模型,今日(2月18日)发布最新版Grok 3聊天机器人,称该模型测试版推理能力超过所有AI模型。
这款新模型成色几何?本期「云启科技π」带你一起了解。
本文转载自“腾讯科技”
原标题《马斯克狂吹的Grok 3,终于发布了》
金鹿 腾讯科技特约编译
2月18日消息,埃隆·马斯克旗下的人工智能初创公司xAI发布最新版Grok 3聊天机器人,同OpenAI和DeepSeek等大模型展开新一轮竞争。马斯克曾多次将Grok 3描述为“地球上最聪明的人工智能”,在上线之前便引起了业界的广泛关注。
马斯克表示,Grok 3首先面向X的Premium Plus 订阅用户开放,他们将作为首批体验者。此外,xAI还为忠实粉丝推出了名为Super Grok的独立订阅服务,提供最先进的功能和最早的新特性访问权限。
xAI表示,Grok 3的预训练已经完成,整个团队一直在积极地将推理能力整合到当前的Grok 3模型中。然而,这种集成仍处于早期阶段,需要更多的改进。Grok 3目前正在继续接受训练。
除了Grok 3推理模型外,xAI还在训练一个该推理模型的迷你版。可以将Grok 3的推理数据与迷你推理模型进行对比,有时其后者的表现甚至会略微优于Grok 3推理模型。
01
号称性能超越
DeepSeek和ChatGPT
在发布会上,马斯克表示,xAI 之所以将其聊天机器人命名为Grok,是因为这个词源自美国科幻作家 罗伯特·海因莱因的小说 《异乡异客》(Stranger in a Strange Land)。在书中,“Grok” 由一位在火星上长大的角色使用,意指对某事物全面且深刻的理解。
马斯克和他的人工智能团队声称,Grok 3测试版的推理能力超过了现有的人工智能模型。在有关推理和测试时间的基准测试中,Grok 3取得了比DeepSeek-R1、OpenAI o1、OpenAI o3 mini- high、Gemini-2 Flash Thinking更优的效果。
根据xAI的比较基准显示,Grok 3在科学、编码和数学方面的得分高于Gemini 2 Pro、Deepseek V3、ChatGPT 4o等。并且,在盲测方面,xAI的Grok-3(早期版本) 在 lmArena 排行榜中以1402 分的历史最高成绩登顶,成为首个突破1400分的AI模型。这一成绩超越了Google、OpenAI、DeepSeek等业界主要竞品。
02
122天打造AI超算中心,
使其性能翻倍
在演示过程中,马斯克和xAI的几位高管分享了他们如何构建Grok。马斯克透露,由于xAI希望尽快推出Grok 3,时间非常紧迫。因此,他们意识到必须在短短四个月内建成数据中心。
xAI表示,他们花了122天让首批10万颗GPU上线并运行,这是目前全球最大的全连接H100集群。随后,xAI进一步加速扩建数据中心,仅用92天便完成第二阶段建设,使计算能力再次翻倍(依此计算约有20万块GPU)。
xAI团队还展示了Grok 3如何执行有趣的任务。例如计算从地球到火星的航天器任务。Grok 3 生成了一张太空发射的动画 3D 轨迹图(即从地球到火星然后再返回地球的可行轨迹)。这涉及一些复杂的物理知识,Grok 3需要理解这些内容。
Grok 3还展示了在自动化游戏开发方面的潜力。xAI团队要求Grok 3现场创造一款融合《俄罗斯方块》和《宝石迷阵》的新游戏。Grok 3生成的Python脚本定义了游戏的常量、颜色、方块形状等元素,并呈现出独特玩法:当连接了至少三个相同颜色的方块时,会触发重力机制使方块消除,这种方式类似《宝石迷阵》。
此外,Grok 3包含一个名为Big Brain的功能,这是一个推理模型模式,允许在处理查询时进行更深入的思考。马斯克指出,17个月前,最初的Grok模型几乎不能解决高中问题,而现在它已经进步了很多,他幽默地比喻“Grok已经准备好上大学了”。
03
开发深度搜索功能、
考虑开源Grok 2
除了推出 Grok 3 之外,xAI 还透露,该公司正在筹建一家人工智能游戏工作室,该工作室将专注于为消费者提供服务。
此外,xAI正在为Grok开发深度搜索功能(DeepSearch)。这将成为其AI智能体的核心能力之一。DeepSearch是一款推理聊天机器人,能够阐述其理解查询内容的过程以及规划回复的方式。演示显示,DeepSearch具有研究、头脑风暴和数据分析等功能。马斯克团队还表示,他们打算“尽快”推出一款基于语音的聊天机器人。
对于Grok 3是否会开源,马斯克表示,“我们通常会在新模型发布的时候,开源上一代模型,所以几个月后,我们也会对Grok 2进行开源。”
随着Grok-3不断刷新纪录,人工智能竞赛正加速升温。xAI通过强化推理能力、构建超大算力集群,并在游戏等应用领域进行实验性探索,正快速跻身DeepSeek、ChatGPT 等头部大模型的竞争行列。Grok-3 的持续迭代表明,AI竞赛不仅未见终点,反而正在进入更激烈的阶段。