凌晨，Qwen又更新了，3090就能跑，3B激活媲美GPT-4o

机器之心前天 15:58

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

Qwen3-30B-A3B-Instruct-2507模型是一款非思考模式的新AI模型，仅需激活30亿参数，便能在多项性能测试中媲美甚至超越业界顶尖闭源模型如Gemini 2.5-Flash和GPT-4o。相较于前代版本，该模型在通用能力、多语言知识覆盖、用户偏好对齐以及长文本理解（提升至256K）等方面均有显著提升。目前，该模型已在魔搭社区和HuggingFace等平台开源，并提供量化版本，为消费级GPU用户提供了新的AI模型运行选择。值得注意的是，该模型为非推理模型，在复杂代码生成等任务上，推理能力的重要性仍是关键考量。

🚀 **性能飞跃与效率突破**：新发布的Qwen3-30B-A3B-Instruct-2507模型，仅激活30亿参数，却在多项基准测试中展现出与Gemini 2.5-Flash（非思考模式）和GPT-4o等顶尖闭源模型相媲美的实力。例如，AIME25成绩从21.6大幅提升至61.3，Arena-Hard v2从24.8提升至69.0，这标志着模型在效率和性能优化上取得了重大进展，计算效率提升速度令人瞩目。

💡 **全方位能力提升**：该模型在通用能力上实现了关键性飞跃，显著增强了指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面的表现。同时，在多语言的长尾知识覆盖方面也取得了显著进步，并且在新模型的主观和开放任务中，更能贴合用户偏好，生成更高质量、更有帮助的回答，长文本理解能力更是提升至256K。

🌐 **开源力量与社区赋能**：Qwen3-30B-A3B-Instruct-2507模型已在魔搭社区和HuggingFace等平台全面开源，并迅速获得了社区的积极响应，出现了更多的使用渠道，甚至包括量化版本。这种开源模式极大地降低了AI模型的运行门槛，使得用户可以在消费级GPU上（如Mac电脑、RTX 3090等）流畅运行，体现了开源社区的巨大能量。

🤔 **非推理模式的局限性探讨**：尽管新模型在多数任务上表现优异，但它属于非推理模型。开发者Simon Willison的对比测试指出，对于需要“开箱即用”的复杂代码生成任务，模型的“推理”能力可能是一个决定性的关键因素。这提示我们在选择和使用AI模型时，需要根据具体应用场景来评估其能力。

🔥 **持续迭代与行业“内卷”**：Qwen团队在深夜发布新模型的举动，再次引发了行业同行的“内卷”效应。然而，这种技术迭代的速度和成果，也让整个AI领域的发展充满活力，用户每天都能见证AI能力的新飞跃，这本身就是一件令人兴奋的事情。

机器之心报道

编辑：张倩

继前段时间密集发布了三款 AI 大模型后，Qwen 凌晨又更新了 —— 原本的 Qwen3-30B-A3B 有了一个新版本：Qwen3-30B-A3B-Instruct-2507。

这个新版本是一个非思考模式（non-thinking mode）的新模型。它的亮点在于，仅激活 30 亿（3B）参数，就能展现出与业界顶尖闭源模型，如谷歌的 Gemini 2.5-Flash（非思考模式）和 OpenAI 的 GPT-4o 相媲美的超强实力，这标志着在模型效率和性能优化上的一次重大突破。

下图展示了该模型的性能数据，可以看出，与更新前的版本相比，新版本在多项测试中都实现了跨越式提升，比如 AIME25 从之前的 21.6 提升到了 61.3，Arena-Hard v2 成绩从 24.8 提升到了 69.0。