智源社区 17小时前
被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

近期,有离职员工爆料称,欧洲AI明星公司Mistral最新模型可能通过“蒸馏”技术直接借鉴了DeepSeek的成果,并对外宣传为自主研发的强化学习成功案例,同时歪曲了基准测试结果。这一爆料在开源AI社区引发了广泛关注和讨论。分析显示,Mistral-small-3.2与DeepSeek-v3在输出模式上高度相似,可能源于“蒸馏”过程。虽然蒸馏本身并非违规,但Mistral可能隐藏了这一事实,被指责为缺乏透明度。Mistral作为欧洲版OpenAI,在全球开源AI领域占据重要地位,此次事件对其声誉和发展带来了不小的影响。目前,Mistral官方尚未对此事做出回应。

🎯 Mistral模型疑似“蒸馏”DeepSeek:一位Mistral离职员工爆料称,公司最新模型可能通过“蒸馏”技术借鉴了DeepSeek的成果,并将其包装成自主研发的RL成功案例,同时歪曲了基准测试结果。这一指控源于模型输出的词汇模式(Slop)分析,发现Mistral-small-3.2与DeepSeek-v3高度相似,通常是蒸馏的结果。

⚖️ 透明度引发争议:蒸馏技术本身在模型开发中被广泛应用,可以快速提升模型能力,但爆料指出Mistral的问题在于可能隐藏了这一事实,假装是自家模型的强化学习成果,从而误导公众和歪曲测试结果。许多人认为,蒸馏模型应标注清晰,保持透明度是关键。

🌟 Mistral的行业地位与影响:Mistral AI成立于2023年,被誉为欧洲版OpenAI,是全球开源AI领域的明星玩家,模型性能备受好评,并已获得巨额融资,估值高达百亿美元。此次关于“蒸馏”的爆料,因其在开源社区的重要地位而备受关注,对公司声誉和未来发展可能产生影响。

🔍 技术分析支持爆料:推特博主Sam Peach通过分析模型在创意写作输出中比人类文本更常出现的词和n-gram(词组),并进行层次聚类,生成了“相似性图”。结果显示Mistral-small-3.2和DeepSeek-v3在图中位置非常接近,有力地支持了两者输出模式高度相似的观点,暗示了蒸馏的可能性。

离职掀桌!Mistral被曝“蒸馏”DeepSeek。

网友在推特上爆料,一位Mistral离职女员工群发邮件,直指公司多项黑幕。

其中最劲爆的就是:Mistral最新模型疑似直接蒸馏自DeepSeek,却对外包装成RL成功案例,并刻意歪曲基准测试结果。

说到Mistral,这家公司被誉为欧洲版OpenAI,是全球开源明星玩家之一,模型性能一直备受好评。

也正因为声誉突出,这次爆料才显得格外震撼。

早在今年6月,就有博主通过“语言指纹”分析,发现Mistral-small-3.2和DeepSeek-v3很像。

有意思的是——今年2月,还有网友调侃DeepSeek是“中国的Mistral”。

结果半年过去,剧情反转:Mistral不仅没跑赢DeepSeek,还被曝“借”了人家的成果。

这波啊,这波叫回旋镖自带GPS,绕半圈又精准扎回自己身上。

Mistral蒸馏DeepSeek实锤

就像我们开头提到的,推特博主Sam Peach通过分析模型输出中过度使用的词汇模式(Slop),发现了Mistral-small-3.2与DeepSeek-v3之间令人惊讶的高度相似性。

这种相似性通常很难通过独立训练偶然出现,所以很可能就是蒸馏(distillation)的结果:

Mistral-small-3.2“学习”了DeepSeek-v3的输出风格。

具体来说,Sam Peach是这样做的。

他先统计了模型在创意写作(creativewriting)的输出中,比人类文本更常出现的词和n-gram(词组)。

然后他把这些把数据整合起来,形成一个特征集。

最后把这些高频特征进行层次聚类(hierarchicalclustering),生成了一张“相似性图”。

通过比较相似性图中模型的远近位置,就可以发现Mistral-small-3.2和DeepSeek-v3在图中非常接近,这就表明了它们的输出模式高度相似。

最新的爆料则进一步指明,Mistral模型和DeepSeek相似不是巧合,而是可能使用了蒸馏。

由于爆料人Susan Zhang的推特设置可见范围,更多爆料信息暂时无从得知。

但这里需要说明,蒸馏并不是一件违规的事,现在很多模型都是通过这一方法快速提升能力。

Mistral的问题在于,可能隐藏了这部分事实。

离职员工说,Mistral这样做是在假装自家模型的强化学习有效,这不仅歪曲了基准测试结果,而且误导公众

不少人也认同这一观点:蒸馏模型必须标注,保持透明性才是关键。

此外还有网友表示,蒸馏实际上为模型开发开辟了一条捷径,好让大家不用再重复造轮子。

官方暂无回应

这事儿颇具争议,除了事件本身,主要还在于Mistral在开源AI圈的地位不低。

它成立于2023年,base法国巴黎,一直被称为欧洲版OpenAI。由前Google DeepMind的Arthur Mensch和前Meta的Guillaume Lample与Timothée Lacroix联合创立。

在今年8月,Mistral被曝估值达到100亿美元,且正在筹集新一轮10亿美元融资。

而在上一轮融资中(2024年6月),Mistral完成了一轮由General Catalyst领投的6亿欧元(6.45亿美元)的融资,这使其估值上升至58亿欧元(62亿美元),排名全球第四(美国湾区外排名第一)。

从公司成立以来,Mistral一直保持开源路线,今年开源的模型就包括轻量级模型Mistral Small和主打编程的Mistral Code等。

相较于主流的大语言模型,主打开源、小快灵的Mistral,在多语言处理和推理能力方面具备相当的竞争力,在大模型市场中占据着独特的地位。

同时他们也推出了自家聊天机器人LeChat,对标ChatGPT,内置深度研究模式、原生多语言推理和高级图像编辑等功能。

截至目前,Mistral官方还没有回应,就在昨天他们还发布了新模型Mistral Medium V3.1。

参考链接:

[1]https://x.com/sam_paech/status/1937786948380434780

[2]https://github.com/sam-paech/slop-forensics

[3]https://techcrunch.com/2025/07/18/what-is-mistral-ai-everything-to-know-about-the-openai-competitor/

[4]https://github.com/sam-paech/slop-forensics


一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

🎉 希望了解AI产品最新趋势?
量子位智库「AI 100」2025上半年
「旗舰产品榜」和「创新产品榜」
给出最新参考👇

🌟 点亮星标 🌟

科技前沿进展每日见

内容中包含的图片若涉及版权问题,请及时与我们联系删除

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Mistral DeepSeek AI模型 蒸馏 开源AI 透明度
相关文章