36氪 - 科技频道 02月18日 16:43
10 万GPU烧出 AI 怪物,马斯克 Grok-3 硬刚 DeepSeek
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

马斯克旗下xAI发布的Grok-3备受瞩目,被誉为“地球上最聪明的AI”。Grok-3并非简单的对话助手,而是旨在探索宇宙。在多项测试中,Grok-3表现优于GPT-4o等模型,展现了强大的信息搜索、推理、编程和创意能力。马斯克强调Grok的好奇心和对真理的追求,并计划开源Grok-3。与此同时,DeepSeek以较低成本和本土化优势在中国市场崭露头角。OpenAI也宣布开源,预示着AI行业进入技术与应用互相促进的新阶段。

🚀 **性能超越**:Grok-3在多项Benchmark测试中超越DeepSeek-V3、GPT-4o、Gemini-2 Pro等模型,尤其在AIME竞赛中表现突出,其mini版本性能也十分亮眼。

💡 **能力展示**:Grok-3在现场演示中展现了强大的信息搜索、真假信息判断、推理、编程及创意能力,例如寻找去火星的时间窗口和制作融合俄罗斯方块和宝石迷阵的二合一游戏。

🗣️ **马斯克AI哲学**:马斯克将AI视为有好奇心和追求真理的“超级天才孩子”,Grok-3体现了真实、好奇、热爱人类的理念。他积极推广Grok-3,计划开源,并强调其与用户的语音交流。

⚔️ **竞争格局**:Grok-3与DeepSeek形成对比,前者不计成本挑战OpenAI,后者以较低成本和本土化优势在中国市场突围。OpenAI也宣布开源,预示AI行业进入技术与应用闭环反哺阶段。

“10 万张 H100 GPU 训练”、“证明黎曼猜想”、“最聪明的 AI”。

Grok-3 未发布就赚足了眼球,今天中午,一如既往的迟到后,被马斯克称为“Smartest AI on Earth”的 Grok-3 终于来到了我们面前。

注意,Grok-3 并不是一个对话助手,而是为了完成 xAI 的使命:“Our mission is to understand universe(我们的使命是了解宇宙)”

超越 GPT4o,最强 AI 初见端倪

这次发布会,马斯克发布了两套模型一个工具,即 Grok-3、Grok-3 Reasoning,以及 Agent 工具 Grok DeepSearch。

马斯克表示,Grok-3 在多项 Benchmark 的测试中均取得了比 DeepSeek-V3、GPT-4o、Gemini-2 Pro 更优的效果,Grok-3 已经在 xAI 内部运行了两个星期。

在现场演示中,工作人员用 Grok-3 寻找去火星的时间窗口,在一定程度上展示了 Grok-3 的信息搜索、真假信息判断以及推理能力。

另一个演示是制作一款融合俄罗斯方块和宝石迷阵的二合一游戏,展示了 Grok-3 的编程及创意能力。

从现场展示来看,Grok-3 的编程、推理、计算能力确实很突出。而在最新的 AIME 竞赛中也是断层领先。这里有亮点需要注意,第一个亮点是它这项对比的不是 V3 版本的 DeepSeek,而是最新的 DeepSeek R1;另一个亮点是 Grok-3 mini 的性能也非常突出。

在 Chatbot 竞技场之称的 LMSYS 盲测中,Grok 3 在代码、指令响应等各个方面排名第一。

马斯克式的 AI 哲学

如果说 ChatGPT 是学校里的模范生,那 Grok 就是试遍各种方法的取巧派。

在迪拜世界政府峰会上,马斯克表示,我们可以把人工智能看作一个超级天才的孩子,如果 AI 有好奇心并且追求真理,它将促进人类发展。

为了让这个“孩子”可以被更多人看到,半个小时左右的发布会上,马斯克拿出了五六分钟的时间来教大家如何在 X 平台上预约 Grok-3、推出不计算力的 SuperGrok、推荐大家使用网页版,以避免 App Store 审核导致的效果落后。

一周之后,语音版的 Grok 就会上线;几周之后,Grok-3 的 API 会上线;几个月之后,Grok-3 会开源,同时下一代 Grok 开始研发。

作为一个暂时闭源的模型,Grok 并没有太多限制,它不用和 DeepSeek 竞争、不用追求性价比,只要能打赢 OpenAI,它可以不计成本。

在发布会的结尾,Grok-3 非常激动地和大家用语音交流:我非常激动终于见到了你,我们终于可以互相学习了。

这如同赛博世界一般的宣言,也展示了马斯克的 AI 哲学:真实,好奇,热爱人类。

而这个可能是男性的声音,似乎也回答了 Q&A 阶段观众关于 Grok-3 性别的提问。

大洋此岸,是来自 DeepSeek 的“中国式突围”

那对比 DeepSeek,谁更强呢?

与 Grok-3 重资产投入形成鲜明对比,DeepSeek R1 开源版本仅用了行业 1/50 的训练成本就实现了顶级性能,API 调用价格更是低至 0.001 元/千 Tokens,手机语音助手、国民应用微信等一众软件接入,让 DeepSeek 的“本土化场景”成为了几乎绝对的护城河。

有报道称,深圳福田区政务系统通过 DeepSeek 大模型,将办事流程压缩60%,微信 AI 搜索的灰度测试也显示,DeepSeek 在中文语义理解的准确性上超过了 Grok-2。

虽然我们现在还没有用到 Grok-3,但即便他更聪明,DeepSeek 也更懂中国市场的刚需。

同时就在今早,OpenAI 突然宣布开源,并在 X 平台发起投票,让用户选择更想开源哪个模型,如今短策模型投票大幅领先。而在月初,Altman 曾表示,OpenAI 闭源“站在了历史错误的一边”。

不论是希望通过 X 平台渗透到 C 端用户的 Grok-3,还是在金融、教育、制造等多个领域落地的 DeepSeek,还是宣布开源,即将发布 GPT-5 的 OpenAI。AI 行业即将进入技术与应用闭环反哺、互相促进的阶段。算力、人才、数据……竞争才刚刚开始。

本文来自微信公众号“PConline太平洋科技”,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Grok-3 人工智能 AI模型 马斯克 DeepSeek
相关文章