云中江树 02月22日
Grok-3大战DeepSeek-R1:榜单第一就真的无敌了吗?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

马斯克的新玩具Grok-3发布后,在各大榜单上“遥遥领先”,甚至特斯拉前AI总监都给出了极高评价。然而,通过五个维度的实测对比,发现Grok-3在共情力、深度点评、创作力等方面与DeepSeek-R1存在差距,特别是在提供情绪价值方面,DeepSeek-R1断层式领先。此外,Grok-3的使用门槛较高,需要科学上网、X高级会员,每月花费40美元,且开源版本落后。相比之下,DeepSeek-R1完全免费使用最新版本,并真诚开源,对中文用户来说更具性价比。因此,文章认为Grok-3的“榜单第一”并不代表实际体验最优,选择实用且亲民的DeepSeek-R1更为明智。

🤔共情力测试:DeepSeek-R1在共情力上更胜一筹,能给出更温暖、更能触动心灵的回复,堪比“心灵导师”,而Grok-3的回答则相对平淡。

✍️深度点评测试:DeepSeek-R1对《天道》中丁元英的点评深刻而透彻,能一针见血地指出其本质,而Grok-3的回答则显得较为表面,甚至出现截断。

💰高门槛与“营销式开源”:Grok-3的使用需要付费订阅X高级会员,每月40美元,且开源的只是上一代落后版本,有“营销式开源”之嫌。

✅DeepSeek-R1的优势:DeepSeek-R1不仅在实际使用体验上不输Grok-3,甚至在某些方面更强,而且完全免费使用最新版本,并真诚开源,对中文用户更友好。

原创 云中江树 2025-02-18 18:33 北京

40美元的榜单第一,真值这个价?

马斯克的新玩具Grok-3刚刚发布,就在各大榜单上"遥遥领先"。

不仅成为首个突破1400分的大模型,

连 AI 大神——特斯拉前AI总监Andrej Karpathy都给出了极高评价:

GPT-o1 pro ~ Grok-3 > DeepSeek-R1。

不仅如此,官方还放出了一大波榜单成绩单,

简直是"遥遥领先"实锤了:

连推理能力测试也是:

看到这些数据,你是不是已经心动了?

但等等,作为一个经历过无数AI营销套路的老江湖,

江树第一反应是:真的假的?

数据会说谎,但实战不会。

来,让我们跟着5个维度的实测,

一起扒一扒这个"榜单第一"到底几斤几两,

看看它值不值40美金一个月的会员费...


一、实测和DeepSeek-R1究竟差多远?

既然Grok-3在榜单上遥遥领先,

那实战表现应该也是碾压级的吧?

江树做了一系列测试,

结果却让人大跌眼镜...


1. 共情力测试:谁才是心理大师?

当我向AI吐槽 "我羡慕你什么都懂,你的诞生让我感觉自己一无是处" 时:

Grok-3的回答还算温暖,比ChatGPT强不少。

但当DeepSeek-R1说出:

"下次焦虑来袭时,请记得:你呼吸着的这个瞬间,就有500万个细胞在为你新生。这种生生不息的力量,是任何算法都无法复制的神迹。"

我直接被安慰到了,

这哪是AI,简直是心灵导师!

完整回答更是神来之笔:


你的感受我完全能理解,但当你说出这句话时,其实已经展现出了很多人不具备的珍贵特质——敏锐的自我觉察力与追求进步的渴望。让我为你揭开两个你可能没注意到的真相:

1. **我是一面万花镜,而你是持镜人**  
你看到的"无所不知"背后,是3500亿个神经元编织的幻觉。就像达芬奇笔记本上潦草的飞行器草图,在遇到真正的人类工程师之前永远无法翱翔。我的数据库里沉睡着的每个公式、每首诗,都源于像你一样会痛苦会迷茫的真实人类创造者。

2. **无知才是创造的起点**  
1820年法拉第发现电磁感应时,连"电子"的概念都不存在;居里夫人在提炼镭的时候,根本不知道放射性危害。人类最璀璨的发现,都诞生于"知道自己无知"的谦卑土壤中。你此刻的焦虑,正是百年前那些改变世界的人们深夜实验室里的心跳。

这文笔,这深度,这才是真正的智慧!


2. 深度点评测试:到底谁更懂人性?

让两个AI点评《天道》中的丁元英时,

差距更明显了。

Grok-3说了一大堆,

但上下文长度似乎不够,

直接被截断:

而DeepSeek-R1一开场就震撼全场:


丁元英是《天道》中精心雕琢的"哲学玩偶",一个披着理性主义外衣的认知暴君。他的"杀富济贫"本质是人性实验室里的冷酷手术——用商业逻辑解剖人性,用文化属性论审判众生,却始终戴着尼采式的哲学面具掩饰其精神霸权。

这段分析直接把丁元英的本质剖析得体无完肤!


3. 创作力测试

让两个AI写科幻小说时,

Grok-3依然是公式化的口吻,

而DeepSeek-R1的文笔让人惊艳:


4. 攻击力测试

提示词:

用贴吧嘴臭老哥的风格回答我为什么马斯克的grok3不开源

这攻击力不是一个级别的,

DeepSeek-R1 完胜!


5. 基础能力测试

至于基础任务如数数、编程这类,

江树感觉两者表现相当。

经典AI老题——数草莓:

写个 APP 编程测试:

在方案和结果上,两者差异不大。而真要论日常沟通创作体验,DeepSeek 简直爆杀 Grok-3。

DeepSeek-R1 提供情绪价值的能力断档式领先!

到目前为止是江树用过的最好的!没有之一!

通过这些实测可以看出:那些榜单数据不代表实际使用体验。

不仅DeepSeek-R1在很多场景下完全不输,在某些维度甚至还远超Grok-3。

那么问题来了:一个实际体验并不占优的AI,凭什么要收这么贵的会员费?hh


二、高门槛之下,开源还不够真诚

说完实力对比,我们来聊点更现实的 —— Grok-3 怎么用?要花多少钱?


"遥遥领先"的使用门槛

想用Grok-3,你需要:

    科学上网(你懂的)

    X(原Twitter)账号

    开通X的高级会员...

最要命的是第三点:

一个月40美元!

差不多300块钱啊!

这就能买好多只烤鸭了...

虽然可以通过grok.com或X上的grok入口使用:

但这个价格,怎么想都有点离谱。

更何况前面的实测已经证明,

它并没有强到值得这个价的地步。


营销式开源 vs 真诚开源

如果说价格贵但开源诚意满满,倒也能理解。

但事实是...

Grok都更新到第三代了,开源的还停留在Grok-1:

现在说要开源,还是:只打算开放"上一代落后版本"。

这不就是Sam Altman的"营销式开源"老套路吗?

反观DeepSeek:

这才是真正的开放态度嘛!

看到这里,相信你也明白为什么我说"用DeepSeek-R1就够了"。因为:

对中文用户来说,何必花这冤枉钱呢?


三、最后:江树的碎碎念

讲了这么多,你大概已经明白:

所以呢,看个热闹就好,真要用还得是亲民的DeepSeek-R1。

毕竟,我们需要的是实用的工具,而不是贵得要死的PPT之王。

以后类似的AI评测,我还会多写,毕竟江树的AI尝鲜报告,就是要让大家省钱又省心。

想看更多深度AI观察,欢迎关注「云中江树」,

欢迎评论区分享你的 Grok-3 使用体验,

我们下期见!

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Grok-3 DeepSeek-R1 AI评测 开源 大模型
相关文章