cnBeta全文版 07月30日 08:10
通义Qwen3非思考模型上新 多项能力达到Gemini2.5、GPT-4o水平
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里巴巴通义千问团队发布了最新开源模型Qwen3-30B-A3B-Instruct-2507。该模型在仅激活3B参数的情况下,性能已能比肩Gemini 2.5-Flash和GPT-4o等闭源模型,并在多语言、用户偏好对齐以及长文本处理(256K)方面取得显著进步。Qwen3-30B-A3B-Instruct-2507在数学推理、代码生成、科学问题解答、指令遵循和工具使用等方面表现优异,部分指标甚至超越了GPT-4o。该模型已在魔搭社区和HuggingFace平台开源,进一步降低了高性能大语言模型的应用门槛,体现了通义千问团队在架构创新和成本优化方面的实力。

💡 **性能卓越,成本优化:** Qwen3-30B-A3B-Instruct-2507模型在较低的3B参数激活下,实现了与Gemini 2.5-Flash、GPT-4o等闭源模型的性能相当,甚至在部分基准测试中超越GPT-4o,如AIME25(61.3)、LiveCodeBenchv6(43.2)、GPQA(70.4)等,展现了其在性能上的强大竞争力,同时大幅降低了计算成本。

🌍 **多语言与长文本处理能力增强:** 该模型在多语言的长尾知识覆盖方面实现了突破性提升,并能更紧密地对齐用户偏好,生成更高质量、更有帮助的回答。其长文本理解能力更是提升至256K,极大地扩展了模型的应用场景。

🚀 **全面提升通用能力:** Qwen3-30B-A3B-Instruct-2507在指令遵循、逻辑推理、数学、科学、编程及工具使用等通用能力上得到了全面强化,为用户在各类复杂任务中提供更强大的支持。

🌐 **开源推动AI发展:** 作为通义千问系列大语言模型的一部分,该模型在魔搭社区和HuggingFace平台全面开源,延续了通义千问团队推动AI技术普惠化的理念。通义千问自发布以来已开源超200个模型,全球下载量超3亿次,显示了其在开源社区的积极贡献。

7月30日,阿里巴巴通义千问团队宣布推出Qwen3系列模型的最新版本 ——Qwen3-30B-A3B-Instruct-2507。这一非思考模式(non-thinking mode)的开源模型仅需激活3B参数,即可在多项核心能力上达到与Gemini 2.5-Flash(non-thinking)、GPT-4o等闭源模型相当的性能水平,同时在多语言覆盖、用户偏好对齐和长文本处理等领域实现突破性提升。

目前,该模型已在魔搭社区(ModelScope)和HuggingFace平台全面开源。


作为Qwen3-30B-A3B模型中的新版本,Qwen3-30B-A3B-Instruct-2507延续了通义千问团队在架构创新上的优势,在大幅降低计算成本的同时,实现了与千亿级闭源模型的性能对标。官方数据显示,该模型在数学推理(AIME25测试得分61.3)、代码生成(LiveCodeBenchv6得分43.2)、研究生级物理和天文学问题(GPQA测试得分70.4)、人类偏好对齐(Arena-Hard v2得分69)、函数调用能力(BFCL-v3得分65.1)等关键基准测试中表现突出,部分指标甚至超越GPT-4o等。


在通用能力层面,模型全面强化了指令遵循、逻辑推理、数学、科学、编程及工具使用等多方面。在多语言的长尾知识覆盖方面,模型进步显著;在主观和开放任务中,新模型与进一步紧密对齐了用户偏好,可以生成更高质量的文本,为用户提供更有帮助的回答;长文本理解能力提升至256K。

通义千问是阿里巴巴达摩院自主研发的大语言模型系列,自2023年发布以来,已开源超200个模型,全球下载量突破3亿次,衍生模型数超10万个。

查看评论

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

通义千问 Qwen3 大语言模型 AI开源 人工智能
相关文章