炸裂！MistralAI 新模型 Devstral-Small 来了：236亿参数，凭啥在软件工程榜单上碾压千亿巨头？

各位 AI 圈的朋友们，又是一个值得熬夜（或者刚刚睡醒刷到）的震撼消息！

以“小而美”著称的 MistralAI，就在刚刚过去的 4 小时，悄悄放出了他们的新家伙—— Devstral-Small-2505。光听名字就知道，这哥们是来搞开发的！参数量定在了 23.6B（236亿），这个数字在如今动辄几千亿、上万亿参数的大模型世界里，看起来不算是个“巨无霸”。

但是！MistralAI 的哲学向来是“以小博大”，这次，他们又把这句话狠狠地印在了大家脑门上。

Devstral-Small-2505 最炸裂的地方在哪里？

答案就在那个充满“血与火”的战场—— SWE-Bench Verified 基准测试。

这个 SWE-Bench Verified 可不是那种随便写写 hello world 的玩具测试，而是真刀真枪的实战！它包含了来自 GitHub 的 500 个真实的软件工程问题，从改 bug、写代码到理解复杂的项目概念，无所不包。能在上面得分，那真是得有两把刷子。

而我们的新同学 Devstral-Small-2505，就在这个硬核榜单上，砍下了 46.8% 的恐怖成绩！

46.8% 是什么概念？

这就是本文的真正高潮部分了，请大家坐稳！

根据 MistralAI 官方放出的信息，这个 23.6B 参数的小模型，在 SWE-Bench Verified 上，竟然超越了两家业界巨头、参数量远超自己的模型：

Qwen3-235B-A22B

2350亿！

DeepSeek-V3/R1

想象一下，一个身材苗条的选手，在专业技能比拼中，不仅追上了，还直接超车了那些重量级的拳王！Devstral-Small-2505 的 46.8% 得分，硬生生把那些几千亿、近万亿参数的模型压在了下面。

这怎么可能？！

这无疑是给整个 AI 社区抛出了一个巨大的问号，但也再次印证了 MistralAI 一贯的技术路线的成功：

极致的效率优化：

精准的领域专精：

小模型，大未来：

总结一下

MistralAI 的 Devstral-Small-2505，虽然名字里带着“Small”，但在软件工程这个专业赛道上，它已经证明了自己是当之无愧的“Big”！凭借 23.6B 参数，它在 SWE-Bench Verified 榜单上以 46.8% 的成绩，漂亮地击败了参数量远超自身的 Qwen3-235B-A22B 和 DeepSeek-V3/R1。

这不仅是 MistralAI 团队技术实力的又一次展示，也是对整个大模型领域的一种启发：参数量不是唯一的王道，高效、精准、领域专精同样能带来突破性的性能。

对于开发者来说，Devstral-Small-2505 无疑是一个值得高度关注的工具。它预示着更强大、更易于部署的 AI 编程助手即将到来。

具体的模型细节、如何获取以及更多使用场景，我们还得紧密关注 MistralAI 的官方后续发布。但可以肯定的是，Devstral-Small-2505 已经在软件工程的 AI 赛道上，投下了一颗重磅炸弹！

期待这个“小个子”在未来带给我们更多惊喜！

如果你也对最新的AI信息感兴趣或者有疑问都可以加入我的大家庭第一时间分享最新AI资讯、工具、教程、文档欢迎你的加入！！！😉😉😉

公众号：墨风如雪小站

我的博客：https://blog.worldcodeing.com/

我的导航站：https://nav.worldcodeing.com/

源码小站：https://www.worldcodeing.com/

Devstral-Small-2505 最炸裂的地方在哪里？

46.8% 是什么概念？

这怎么可能？！

总结一下

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签