AI大模型工场 03月03日
啊!从"馕言"到扫雷,Grok3竟靠邓丽君歌词逆袭?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文对阿里最新推出的推理模型QwQ-Max预览版,以及马斯克号称“地表最强”的Grok3和国产黑马DeepSeek进行了多维度评测。通过“馕言馕语”翻译、数学竞赛题解答、扫雷游戏代码生成等测试,对比了三款模型在深度思考、联网搜索、资料整合、代码开发等方面的能力。结果显示,QwQ-Max在开源与综合性能上具备潜力,Grok3细节处理与资料整合能力突出,DeepSeek则保持稳定高效的国产黑马姿态。展现了AI推理领域多样化的技术路径与竞争格局。

🗣️ QwQ-Max:基于Qwen2.5-Max的推理模型,支持深度思考和联网搜索,并展示完整的思维链。在“馕言”翻译和数学题解答中表现出色,代码开发注重交互细节,嵌入视觉图标提升用户界面直观性。

🧠 Grok3:马斯克号称“地表最强”的模型,资料库丰富,在“馕言”翻译中引用邓丽君歌词。数学题解析思路清晰,步骤详尽,适合辅助学习。代码开发同样注重交互细节。

🚀 DeepSeek:国产黑马,在各项测试中均表现出色,尤其在数学题解答中思路清晰,系统繁忙次数较少。代码逻辑简洁高效,界面设计基础,适合对界面要求低但重视代码健壮性的场景。

🌐 三款模型均支持网页端一键运行扫雷游戏代码,对编程“小白”友好,但在细节处理上存在差异。QwQ-Max与Grok3在扫雷游戏中嵌入“雷”的视觉图标,提升用户界面(UI)的直观性;DeepSeek代码逻辑简洁高效,但界面设计较为基础。

原创 西梅汁 2025-03-03 18:18 北京

从方言到代码均“手拿把掐”



作者西梅汁

编辑|星奈

媒体|AI大模型工场



才测完阿里的Qwen2.5-Max的新模型没多久,这不,最近阿里又推出了第一款推理模型QwQ-Max的预览版。


据了解,QwQ是在QWQ-MAX-PREVIEW支持下,一个基于Qwen2.5-Max的推理模型,可同时支持深度思考和联网搜索,并会展示完整的思维链。


官方表示,在不久的未来将开源QwQ—Max,当天晚上,阿里又同步开源视频模型万相2.1,截至目前,该模型已经登顶全球开源榜首!阿里这波"源神"操作,属实把开源精神玩明白了。


话都说到这了,那AI大模型工场再把最近马斯克号称「地表最强」的 Grok3以及我们的国产黑马DeepSeek拉出来跑跑~



挑战”馕言馕语“



最近新疆人的说话语序可被大家玩坏了,看到好多新疆“馕言文”真的太有意思了,有一种看得懂,但是一辈子都说不出来的比喻,那我们试试问问AI是否可以翻译出来呢!



1、QWQ-MAX


2、Grok3


3、DeepSeek


你别说,你还真别说!推理模式下,QWQ、Grok3、DeepSeek这三个AI对新疆“馕言”的独特句式都分析的头头是道,并且也都翻译出了“喝酒不开车,开车不喝酒”的意思。




根据显示可以看到Grok3的资料库还挺丰富,引用的资料中居然还包含了邓丽君的歌词!



跑跑数学竞赛



在翻译完句子后,再用一道数学竞赛题,测测看几个模型的表现


1、QWQ-MAX


2、Grok3


3、DeepSeek


三款模型给出的答案都是正确的,但解题思路差异明显,QWQ解题过程相对比较简洁,过程中还有一些看不懂的字母;Grok3题目解析思路很清晰,步骤详尽且符合教育场景需求,更加适合辅助学习;DeepSeek思路也同样清晰,目前测下来,系统繁忙的次数也减少很多。



扫雷游戏的开发竞技



最后,咱们再通过生成扫雷游戏代码验证开发能力,三者均支持网页端一键运行,对编程“小白”友好,但细节处理存在差异。


1、QWQ-MAX


2、Grok3


3、DeepSeek


精细度把握上,可以看到QwQ-Max与Grok3更加注重代码交互细节,在扫雷游戏中嵌入了“雷”的视觉图标,提升用户界面(UI)的直观性;DeepSeek代码逻辑简洁高效,但界面设计较为基础,更适合对界面要求低但重视代码健壮性的场景。


整体来看,QwQ-Max依托超大规模MoE架构,在开源与综合性能上具备潜力;Grok3细节处理与资料整合能力突出;DeepSeek则保持稳定高效的国产黑马姿态。三款模型各有所长,展现了AI推理领域多样化的技术路径与竞争格局!


AIGC大模型工场已经组织了非常精准的「AI大模型垂直社群」,覆盖超1000位AIGC圈,百度大模型业务负责人,京东大模型业务负责人,腾讯大模型业务人,阿里云大模型技术负责人,科大讯飞大模型公关,商汤大模型业务,阅文大模型公关,360大模型公关负责人都在群里啦,欢迎大模型业务负责人加入。请加微信fqq2000nian,注明真实身份。




数据支持天眼查,大模型独家合作账号


— END —


监制 / 刘老师

编辑 / AIGCCCCC

视觉 / 大模型

微博 / @AI大模型工场

TG/AI  Marketing Field


  


大模型应用创业者,你怎么看


■ 百度文心一言 阿里通义千问 ▍通用大模型案例

■ 科大讯飞星火 京东 ▍产业大模型案例

■ 商汤日日新,腾讯,昆仑万维 ▍ 金融大模型案例

■ 盘古大模型,中国电信,医联 ▍医疗大模型案例

■阅文大模型,腾讯音乐大模型 ▍文娱大模型案例

■知乎,360大模型,火山引擎 ▍ 教育大模型案例

■  网易,金山办公大模型 ▍更多行业大模型案例



上次介绍搭载DeepSeek的答疑笔面世:AI调至“学习专用模式”?





本文由大模型领域垂直媒体「AI大模型工场」

原创出品,未经许可,请勿转载。 

/

欢迎提供新的大模型商业化落地思路

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI推理模型 Qwen2.5-Max Grok3 DeepSeek AIGC
相关文章