智源社区 前天 10:38
核心模型被曝蒸馏DeepSeek?前女友一纸控诉,曝出欧版OpenAI塌房真相!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

法国AI公司Mistral AI近期陷入“套壳”争议。一篇由Mistral前员工发布的“分手小作文”爆料称,Mistral的新模型实际上是蒸馏自DeepSeek,并被指控存在误导用户、歪曲基准测试结果等不道德行为。该爆料引发了AI社区的广泛讨论,DeepMind研究员等业内人士也对此表示关注。尽管蒸馏开源模型在技术上并非错误,但Mistral被批评在于缺乏透明度,未能清晰标注模型的来源,并将成果归功于自身研发的RL方法。文章回顾了Mistral AI成立初期的辉煌,以及其作为欧洲AI代表的期望,并指出此次事件对其声誉造成了不小的影响。

💡 Mistral AI被指控使用“蒸馏”技术,将DeepSeek模型的核心能力“套壳”为自己的产品。有前员工在“分手小作文”中详细描述了公司的不道德行为,包括误导用户称模型是自主研发的RL成果,实则为DS3的产物,并歪曲了基准测试结果。

🔍 业内人士通过技术分析发现了Mistral Small 3.2与DeepSeek-v3在创意写作输出上的高度相似性。通过对比词语和n-gram词组的特征,研究表明两个模型在谱系图中的位置极其接近,暗示了其内在的相似性,这进一步支持了“套壳”的说法。

⚖️ 蒸馏开源模型本身在AI领域是一种常见且实用的技术,允许小模型模仿大模型的输出以降低资源消耗。然而,Mistral的问题并非在于蒸馏本身,而在于其缺乏透明度,未能如实告知用户模型的来源,并将进步归功于自身而非清晰标注蒸馏自其他模型。

🚀 Mistral AI曾被视为欧洲AI产业的希望,以开源、高效、注重隐私的模式颠覆硅谷传统,并在短时间内取得了SOTA开源大语言模型的成就,赢得了广泛赞誉和支持。此次争议对其过往的辉煌和未来发展蒙上了一层阴影。

编辑:Aeneas KingHZ

Mistal套壳DeepSeek,被当场抓现行了?

几天前就有人在X上爆料:Mistral的新模型是直接蒸馏自DeepSeek,而且基准测试结果还被歪曲了。

这个被视为欧洲版OpenAI「全村希望」的公司,地位就如同中国的DeepSeek一般,如今居然塌房了?

这实在是太魔幻了。

更为劲爆的是,这个重磅大瓜还是从一篇Mistral女员工的「分手小作文」里曝出来的。

原话是这样的——

你早知道Mistral做事不讲道德:把DeepSeek蒸馏后当成自己的模型,使用OpenAI的数据,对外却误导称是RL在发挥作用,但它实际上只是DS3的产物,还歪曲基准测试结果。

你不仅明知这些,还积极参与其中。当我指出这些问题时,你没有承担任何责任,反而选择无视我、对我冷处理。

情感纠纷小作文
曝出套壳大瓜

也就是说,这位Mistral离职的女员工,不仅在小作文中曝光了自己和前男友、Mistral同事的感情纠葛,还爆出Mistral套壳DeepSeek的丑闻。

这个消息一曝光,立马在全网引起了轩然大波。

DeepMind研究员Susan Zhang转发并评论,直接点名Mistral AI的不道德行为。

在「小作文」里,这位Mistral前员工痛诉自己如何接连遭遇上司排挤、伴侣出轨、求职无望,还要靠抗抑郁药物试图让情感生活重回正轨。

关键节点在2025年4月初, Mistral把她解雇了,原因在于工作分歧:

她明确反对通过蒸馏DeepSeek来误导用户。

这加剧了她对Mistral高层的不满——而她的伴侣又和高层关系密切。

在职业前途未卜、经济压力加剧、感情关系又充满不确定的三重打击下,她开始崩溃。

这让DeepMind研究科学家Andreas Kirsch非常同情。🙏

Mistral的「秘方」竟是DeepSeek,这一事实让人无语。

火眼金睛博主
早发现Mistral蒸馏DeepSeek

其实早在今年6月,就有一位火眼金睛的AI行内人发现,Mistral Small 3.2写的东西,它怎么这么像DeepSeek呢!

这位名为Sam Paech的行内人,同时还是EQ-Bench基准的维护者,可谓十分有眼光。

为了比较Mistral-small-3.2和DeepSeek-v3之间的相似性,这位博主在模型的创意写作输出中,提取了跟人类基线相比最过度呈现的单词和n-gram词组。

通过对这些词/n-gram中的前几百个数据特征进行层次聚类,生成了一张如下的相似性图。

肉眼可见,Mistral-small-3.2和DeepSeek-v3在谱系图中的位置非常接近,从而表明它们的特征是极其相似的。

这个过程中,他使用了一个生物信息学工具,基于slop特征谱的相似性,推断出了谱系树。

Susan Zhang对此直接表示,Mistral这身皮被扒下来,原来是DeepSeek啊!

甚至还有人发现,连Gemini Pro 2.5都和DeepSeek-R1之间有非常相似的感觉。

比如DeepSeek-R1非常擅长在对话中保持角色的一致性,而Gemini Pro 2.5也是如此,简直惊人的相似。


蒸馏不是错

HuggingFace联合创始人兼首席执行官表示,蒸馏开源模型有错吗?

毕竟,开源的意义之一就是让大家「自由使用」源代码,所以DeepSeek并不会禁止蒸馏。

而且蒸馏大模型也不简单,DeepSeek蒸馏自己的R1模型就不太成功。Paech本人也表示,其实蒸馏也不算什么大错,现在很多模型都是这么干的。

技术上,蒸馏是通过让小模型模仿大模型的输出结果来实现的。

大模型会把自己的「经验」(比如语言模式、写作风格)以一种简单的方式传给小模型。小模型通过大量练习,逐渐学会了类似的表现,但用更少的计算资源。

这种方法在AI领域很流行,因为这项技术很实用,比如能让大模型跑在手机或其他低性能设备上。

蒸馏本身不是错,编造谎言才是问题的实质!

说到头来,Mistral的问题不在于蒸馏DeepSeek,而在于把模型的进步归功于自家的RL方法,甚至蓄意改变基准测试。

没有清楚标注模型是蒸馏的,缺乏透明度,才是最关键的问题。

Mistral好像不止一次这么干,博士生Regi Kusumaatmadjia就发现Mistral的OCR功能与Mineru的OCR出奇的相似。

Mistral过去的高光时刻

想当初,Mistral可是深夜发一条磁力链接,就能让整个开源圈震撼的存在。

在今年2月,才成立一年多的Mistral AI已经估值62亿美金,成为法国的骄傲,欧洲的骄傲。

欧洲的开发者们一度欢呼:恭喜Mistral AI,让欧洲在AI竞赛中终于有了一席之地。

Mistral AI的超级应用助手Le Chat,还一度登顶法国免费APP的榜首。

马克龙一直以来也积极支持Mistral,称其为:「法国人工智能产业的皇冠上瑰宝」。

2023年,这三位来自谷歌DeepMind、Meta的前员工希望打造一家遵循欧洲模式的AI公司——开源、高效、注重隐私。

随后,他们就用自己的方式,颠覆了硅谷的传统。

在当时,当OpenAI斥资超1亿美金训练GPT-4时,Mistral仅用2200万美元就打造出了最具竞争力的AI模型。

甚至马克龙还信誓旦旦表示,法国未来几年将投资1090亿欧元用于建设AI,尽最大努力为包括Mistral在内的公司创造空间。

在成立仅仅七个月的时间里,Mistral就在两个主要「权重级别」上发布了SOTA开源大语言模型(mistral-7b 和 mixtral)。

Mistral在底层架构持续取得突破(如sparse mixture-of-experts,稀疏专家混合架构)。

这对一家初创公司而言,成就非凡。

刚刚,他们还推出了Mistral Medium 3.1,表示整体性能提升巨大。

不过,这次推文底下质疑声不断。

谁都没想到,当初承载了多少人希望的Mistral,如今竟发展到了这一步。
参考资料:
https://x.com/ns123abc/status/1955044877110071480
https://x.com/gmmvg/status/1955002717698658719
https://x.com/paulopacitti/status/1955003793927524717


内容中包含的图片若涉及版权问题,请及时与我们联系删除

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Mistral AI DeepSeek AI模型 蒸馏技术 行业争议
相关文章