原创 歸藏的 AI 工具箱 2025-02-18 13:29 北京
这次马斯克开始玩真的了,不仅模型的素质跟上了 Open AI 的 O1,而且在产品功能上全面对标 ChatGPT。
从 24 年底马斯克就开始给他们新建巨大计算中心训练的 Grok3 模型开始预热了,今天中午 12 点的直播活动中终于发布了 Grok3。
这次马斯克开始玩真的了,不仅模型的素质跟上了 Open AI 的 O1,而且在产品功能上全面对标 ChatGPT。
训练的硬件
Musk 声称 Grok 3 的开发使用了比其前身 Grok 2“10 倍”多的计算资源,xAI 一直在使用位于孟菲斯的一个庞大数据中心——一个包含约 20 万个 GPU 的数据中心——来训练 Grok 3。其中的一期工程只用了 122 天就完成了,工程这块还得看马斯克。
模型能力
Grok 3 的训练量是 Grok 2 的 10 倍,在 1 月初完成了预训练,即使现在依然在训练过程中。
Grok3 包含两个模型版本 Grok3 和 Grok3-mini,Grok 3 AIME 和 GPQA 在内的基准测试中显著优于其他模型,如 Gemini 2 Pro 和 GPT-4o。即使是 Grok-3 mini 也表现不错。目前的早期版本在 Elo 机制的 LLM 竞技场 1400 分排第一。
同时 Grok3 也具备推理能力,马斯克表示在代码能力上 Grok3 非常强,同时在推理时不会展示原始思考过程。
至于推理性能,在提供更多测试时间计算资源(使其能够思考更长时间)的情况下,它优于 o1 和 DeepSeek-R1。
Grok 3 Reasoning Beta 在 AIME 2025 上的表现也高于 o3-mini-high。
深度搜索功能
除了模型能力对标 Open AI 之外,前沿的 Agents 能力也必须更上,Grok3 支持类似 Open AI 深度研究的 DeepSearch能力。
这个功能模型能够深入思考用户意图、需要考虑哪些事实、要浏览多少个网站、可以交叉验证不同来源,确保信息的真实性。DeepSearch 还会公开其执行搜索本身所采取的步骤。
如何使用和收费
目前最先可以体验到 Grok3 的渠道应该是推特的 X Premium+ 会员,同时他们也推出了单独的 Grok 网站和 APP。
另外还有搭配单独有用的 Super Grok 会员,支持 Grok 3的权限、解锁DeepSearch和Think功能、抢先体验新功能、更高的图像生成限制等。
未来规划
网页和应用的所有功能会在一周内推全、API 会在几周内推出。
一周后还会有由 Grok 驱动的语音应用即将推出。
另外 Grok2 可能会在几个月后开源,最后一个版本将在最新版本完全发布后开源
相关链接:
直播回放:https://x.com/xai/status/1891699715298730482
Grok 平台:https://grok.com/
XAI 开发者平台:https://console.x.ai/
整理和输出不易,如果觉得有帮助可以帮我点个赞?或者喜欢?