“偷”?数据，用特斯拉显卡，马斯克把AI炼成啥样了？

差评 2024年08月16日

“偷”?数据，用特斯拉显卡，马斯克把AI炼成啥样了？

马斯克旗下的 xAI 推出了新一代 AI 模型 Grok2，它在多项能力上都达到了业界领先水平，包括图片生成、基础能力、数学计算等。虽然 Grok2 表现出色，但其获取数据的方式却引发争议，包括利用特斯拉资源、修改 X 平台用户默认设置等，甚至面临着法律诉讼。

😄 Grok2 在图片生成能力上展现了独特的优势，相比其他 AI 模型，它更具创意和大胆，能够生成更具冲击力的图像，例如将马斯克恶搞成各种角色。

🤔 Grok2 在基础能力上也取得了显著提升，例如在小数比较、数数等方面表现出色，甚至在数学计算方面也展现出较高的准确性。

⚠️ 然而，Grok2 的发展过程中也伴随着争议，例如利用特斯拉资源、修改 X 平台用户默认设置等行为，引发了特斯拉股东和数据保护机构的起诉。

🚀 尽管存在争议，Grok2 的出现仍然标志着马斯克在 AI 领域的强势进军，它将与其他大模型竞争，并为用户带来更加丰富的体验。

💡 未来，xAI 将进一步整合 Grok 到 X 平台，并推出多模态理解的预览版 AI，令人期待马斯克在 AI 领域将创造出怎样的新突破。

原创世超 2024-08-16 00:00 浙江

马斯克有点偏心了

有个怪事儿，前段时间，大模型竞技场上，一位代码为 sus-column-r 的匿名模型横空出世。

没人知道它师出何门，但在过去的一个月里，它却称得上是过关斩将。。。

累计一万多人的投票，硬生生让它挤进了排行榜前列。到现在，综合能力已经和 5 月 13 号发的 GPT-4o （ API 版本）并列第三了。

看这势头，当时就有不少人猜测，这可能是 OpenAI 那个迟迟没向大众公布的，神秘的 “ 草莓 Q* ” 项目。

然而，就在昨天，这个困扰大伙儿很久的谜语，终于有答案了。但解开它的，不是 OpenAI ，而是经常被大家忽略，但也在搞 AI 的马斯克。

这个匿名的 sus-column-r 模型，其实就是 xAI 要推出的新模型 Grok2 ，现在已经上线会员版的 X 了。

而之所以在大模型竞技场上整这么一出，说白了，是想给昨天的发布热热场子。

像是在官宣推出 Grok2 的博客里，就明晃晃地展示了之前 sus-column-r 积累的战绩，甚至还做了对战胜率表。

按照他们自个儿的说法，表里面除了谷歌的 Gemini 1.5 Pro 外，其余无论是 GPT-4o ，还是 Claude3.5 Sonnet ，都只能是 Grok2 的 “ 手下败将 ” 。

当然了，其他的纸面成绩， Grok2 答得也挺不错。光从各个基准的数据来看，它的各项能力，都和市面上最先进的 AI 差不多，这一线大模型的行列，也算是被 Grok 给挤进去了。

不过在世超的标准里，一个模型好不好，光看这些数据也还不行，最重要的是，得看大伙们的实际使用体验。

相较于上次的还只能文字开开玩笑的 Grok1.5 ，这次 Grok2 最明显的一个升级，就是新增了图片功能。

但和其他家自己动手搞多模态 AI 不一样，这次马斯克倒挺罕见地选择了和别人合作。

合作的对象，差友们应该还有点印象，就是前两天咱刚写过的 FLUX.1 。

看到这，世超也没对 Grok2 的图片功能抱太大的期待，毕竟是前脚刚试过的 AI 。。。

但没想到集成到 Grok2 里面的 FLUX.1 ，还真撞出了一点不一样的火花。

倒也不是说，在性能上它一夜之间飙升了一大截。而是相较于市面上的其他图片 AI ， Grok2 的整活能力可以称得上是一骑绝尘。

同样是迪士尼公主的一个提示词， Grok2 在尺度上就比其他模型要大胆的多。

而且， Grok2 还能直接对着自己的老板恶搞，比如这是一个爱吃甜品，吃到发胖的马斯克。

转眼，他还能穿越到权力的游戏里，玩角色扮演。

更搞的是，还有网友直接拿 Grok2 生成的图，和视频 AI 配合起来，做起了视频。

不过， Grok2 这么肆无忌惮地恶搞各种公众人物、卡通人物，风险肯定还是有的。

像是有网友生成马里奥抽烟喝酒、观望 “ 911 ” 事件的图片，就已经有人督促任天堂起诉了。

除了新增有图片功能外， Grok2 这次提升的基础能力，咱肯定也得上手测测，看看实力。

考虑到目前 X 上线的，还只是性能差一点的小杯 mini 版，于是世超在大模型竞技场上，试用了下能力更强的 Grok2 ，还拉来了最新版本的 GPT-4o 作比较。

比试第一招，先从 AI 容易犯错的题目开始。前段时间，大模型集体在 “ 小数比较 ” 上翻车，大伙应该都听说过了。

这次再来波经典重现，让它俩来比比 9.5 和 9.11 的大小。

没想到的是， GPT-4o 依旧是死性不改，结果对了，但一看解题思路，完全就是一塌糊涂。反倒是 Grok2 倒有理有据，给出了正确答案。

还有经典的数数问题， GPT-4o 依旧让人大跌眼镜， “ 我一把把把把住了 ” 它竟然数出来 5 个把字， Grok2 这边倒还是稳定发挥。

不过紧接着问它俩这句话的意思， Grok2 就有点露怯了，乱说了一大堆，没一个踩到得分点。而这次 GPT-4o 简单几句话就给解释清楚了。

接下来世超又试了一些比较基础的常识性问题，比如说 “ 李政道是谁 ” ，它俩回答的，都还算正确。就是不知道为啥， GPT-4o 很容易犯懒，草草几句话就结束了。

而 Grok2 这边，每次给出得答案都挺详细，还贴心地分了类。

反正世超在实际用的时候，是真有感觉到 Grok2 能力的提升。

另外，按照官方给的数据，这次 Grok2 在数学这块儿，也能算得贼溜了。

于是我就又翻出了之前 Grok 做错的那道数学题，是一道求导的问题。

结果马斯克还真没忽悠咱，它俩都把这道题给整明白了。

而把 Grok 奶成现在的模样，马斯克在背后出得力可不止一星半点儿。

但有意思的是，马斯克主打的，就是薅自己其他公司的羊毛。。。

先是员工这块儿， xAI 统共就只有 50 来个员工，其中有 11 个都是在特斯拉工作的，而且里面还有 6 个是在 Autopilot 团队工作的，是一点儿都不想避嫌。

据华尔街日报消息，甚至原本要给特斯拉用的 GPU ，也被马斯克要求优先供应给 xAI ，还冠冕堂皇的说，特斯拉现在也没地儿用，在仓库里放着也是放着。

偷完特斯拉的家，还不过瘾，马斯克把手也伸到了 X 上。

就在前两天，科技媒体 Techcrunch 称，为了 “ 悄悄 ” 用用户们的数据训练 AI ， X 在更新的时候，还偷摸着把用户的默认设置给改了，而且要关掉还得专门登录网页版。。。

不过总这么偷家，难免会吃上官司。像是马斯克和他的 X ，就被特斯拉的股东，还有好几个国家的数据保护机构给起诉了。

目前，关于特斯拉的案件，已经在特拉华州的一个法院审理了。

而另外几个数据保护机构，也把 X 告得，暂停用用户数据训练 Grok 了。甚至 X 还有可能遭到 “ 4% 平台营业额 ” 的罚款。

但无论如何，在大模型这块儿，马斯克的 Grok 也算是真正赶上大家伙的进度了。和其他大模型比，不管是图片生成，还是其他基础能力上， Grok2 都不算差，甚至还整出了一点儿自己的特色。

据说， xAI 下一步会把 Grok 更深入地揉到 X 平台上面，而且还要再发一个多模态理解的预览版 AI 。

不知道为啥，世超已经有点期待，马斯克还能整出什么花活儿来了。。。

撰文：松鼠

编辑：江江

美编：

图片、资料来源：

X、WSJ、Techcrunch

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Grok2 xAI 马斯克 AI 大模型

相关文章

【iThome 2024 CIO大調查系列 1｜CIO年度目標】CIO更重視開創型IT戰略，AI創新優先度今年驟增

How popular is ChatGPT? Part 1: more popular than Taylor Swift

Weka Makes Life Simpler for Developers, Engineers, and Architects

回顾我的 prompt 能力从小白到熟练的一些重要节点：防杠叠甲： 1. 仅代表我自己的认知，没啥权威性。 2. 认为提示词那么简单至于搞那么复杂么的朋友，你对 3. ...

✨ 人人都能用好AI，这款GPTs 助你定制高效工作流：Prompt for me 作为一个AI布道者，Hans 在即刻写下数百篇新产品介绍、模型研究和心得，却仍感受到不同领域和...

Redundancy in AI: A Hybrid Convolutional Neural Networks CNN Approach to Minimize Computational Overhead in Reliable Execution

OpenAI计划下周宣布ChatGPT和GPT-4更新，但不会推出GPT-5和搜索引擎

Intersect360 Research Takes a Deep Dive into the HPC-AI Market in New Report

SAP大中华区总裁黄陈宏：SAP不做大模型

Is the Future of Retail AI in the Hands of CTOs?