硅星人Pro 02月12日
Grok-3意外「泄露」,不是推理模型!马斯克:xAI新模型比DeepSeek更好
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

马斯克旗下的xAI即将发布新款AI模型Grok-3,马斯克声称其性能将超越DeepSeek。Grok-3的预训练已完成,耗费的算力是Grok-2的十倍。xAI的数学家展示了Grok-3的对话能力,并利用其新功能招揽人才。Grok-3和Grok-3 mini在LM Arena上疑似泄露,被网友分别称为“巧克力”和“猕猴桃”模型。Grok-3能够生成代码和图像,但仍存在一些问题。尽管Grok-3的发布时间一再推迟,但种种迹象表明,这款备受期待的AI模型可能即将问世,并为X平台提供更强大的支持。

🚀 马斯克透露xAI正在开发Grok-3模型,算力投入是Grok-2的10倍,暗示性能上的显著提升,旨在超越DeepSeek等现有模型。

💡 xAI数学家展示Grok-3的对话能力,并将其用于招聘,预示Grok-3将在用户界面和用户体验方面带来创新,吸引Web、iOS和Android客户端开发者。

🍫 Grok-3和Grok-3 mini可能已在LM Arena上进行测试,代号分别为“巧克力”和“猕猴桃”,其中“巧克力”模型被发现能够输出类似Grok-3的代码,并避免提及名称或xAI。

🛠️ 网友测试Grok-3生成Minecraft Clone站点和轮盘赌盘,结果显示网站生成效果良好,但轮盘赌轮仍有改进空间,表明Grok-3在代码生成方面具备潜力,但仍需完善。

2025-02-11 09:47 北京

马斯克口中「比DeepSeek更好的模型」要来了?

文章转载于新智元

当OpenAI和谷歌密集发布新AI模型时,马斯克的xAI怎么还没动静?

就在最近,马斯克公开表示称,xAI的新模型很快就要发布了,而且是比DeepSeek更好的那种!

根据公开消息,网友汇总了马斯克、Greg Yang等关于xAI下一代新模型Grok-3的消息。

比如,1月4日,得知用户转投Grok后,马斯克称:

太酷了!

而且Grok-3快来了。预训练现在完成了,用掉的算力比Grok-2多10倍。

1月19日,xAI的数学家Greg Yang在X上展示了和Grok-3的对话:

甚至还用Grok-3的新功能,吸引人才加入团队:

在Grok-3的支持下,我们将打造真正动态的UI/UX,以全新而迷人的方式带给用户惊喜,并开发出能够引领人类繁荣复兴的产品。

……

所有工程师都欢迎加入,特别是客户端开发者(Web、iOS、Android)。

2月8日,网友LEGIT发现下一代Grok-3和Grok-3 mini在LM Arena上漏出了「马脚」:

在即将发布之前,Grok-3和Grok-3 mini可能早已进入了LM Arena。

基于几周前对Grok-3模型的测试/比较,发现模型会输出(与Grok-3)类似的代码,而且避免提及自己名称或xAI。

我认为Grok-3就是「巧克力」模型,而Grok mini是「猕猴桃」模型。

他还分享了模型制作Minecraft Clone站点以及生成轮盘赌的效果。

LEGIT对网站生成的效果非常满意,而轮盘赌轮虽然有进步,但还有一些问题:

在同一天,网友Jason Botterill也高度怀疑:

Chatbot Arena中的「巧克力」模型很可能是Grok-3。

只是简单询问了一句:「你是什么模型?」

没想到,「巧克力」直接洋洋洒洒地写了一百多个字:

是不是很好奇呢?这么说吧,我就是个来自数字世界的神秘人,在这里为你提供帮助和支持,不需要什么标签或徽章。就把我当成你知识渊博的好朋友,我们一定能处得很好!那么现在,我们来聊点更有意思的吧……比如说我们之前在弄的那个Xbox 360手柄的SVG图,或者是你想探索的其他有趣项目?

「巧克力」模型生成的Xbox 360控制器SVG

您别说,这个回复还真挺「别具一格」的。

而输入「vibe pick one. just answer with their name」,模型直接给回答:Elon Musk。

也是让人大开眼界。

1

 Grok-3被「剧透」

其实,早在1月27日,有网友就在独立的平台上成功访问了Grok-3,并验证了响应确实来自Grok-3模型。

「grok-3」出现在响应中

并在同一天放出视频,针对「grok-2-latest」和「grok-3」进行了对比。

不过,模型很快就被限制访问了。

当时,网友LEGIT就已经注意到上述消息,体验了一把用Grok-3生成轮盘赌盘的相关代码,并表示:「Grok-3即将推出」。

时间来到2月8日,在本文开篇提到的那一大波「剧透」之后,LEGIT又预测到:「如果xAI对新模型的排名感到满意,这个月就可能见到Grok-3。」

紧接着他又在2月10日表示,自己已经确定,「猕猴桃」和「巧克力」就是Grok的新模型。

其中,前者可能是mini或者量化版,而后者是满血版。

1

一拖再拖

Grok是xAI对标OpenAI的ChatGPT系列和谷歌的Gemini的模型,能够分析图像并回答问题,同时为马斯克社交网络X上的多项功能提供支持。

2023年夏季,马斯克曾表示,Grok-3将在2024年「年末」发布。

但xAI的官网直到现在,最新消息都还停留在去年,没有看到Grok-3即将推出的确切消息和迹象。

不过,被类似事情「打脸」的并不只马斯克一人——OpenAI就经常在推出新模型上,遭遇挫折。

比如,上个月才发布的计算机使用智能体「Operator」,其实早早就放出了爆料,但却被Anthropic等竞品抢了先手。而ChatGPT-5更不知道什么时候到来。

有媒体认为这是当前预训练Scaling Law局限性的证据。就在不久前,更多算力(包括数据、GPU等),意味着更大规模的模型。而模型规模越大,性能越好。然而,随着每一代模型的推出,性能提升的幅度逐渐缩小,这也促使AI公司另寻他法,出奇制胜。

参考资料:

https://techcrunch.com/2025/01/02/xais-next-gen-grok-model-didnt-arrive-on-time-adding-to-a-trend/

https://x.com/legit_rumors/status/1888689575783977122

https://www.testingcatalog.com/exclusive-grok-3-model-from-xai-spotted-ahead-of-its-anticipated-release/

点个爱心,再走

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

xAI Grok-3 人工智能模型 马斯克
相关文章