IT之家 07月30日 07:04
阿里通义千问更新 Qwen3-30B 非思考模型:AI 性能媲美 GPT-4o,推理、代码、数学等能力全面跃升
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里通义千问近期在X平台发布了Qwen3-30B-A3B-Instruct-2507模型,该模型在激活3B参数的情况下,性能已接近GPT-4o和Qwen3-235B-A22B Non-Thinking。新模型主要在指令跟随、逻辑推理、文本理解、数学、科学、编程和工具使用等方面进行了显著提升。其参数总量为305亿,激活参数为33亿,支持262144个tokens的上下文长度,并且专为非思考模式设计,输出不再包含思考块。官方表示,该模型在多种语言的长尾知识覆盖方面有大幅增加,并能在主观和开放式任务中提供更符合用户偏好、更有帮助的回答和更高质量的文本生成。

💡 Qwen3-30B-A3B-Instruct-2507模型发布:阿里通义千问推出了Qwen3-30B-A3B-Instruct-2507这一更新模型,旨在提升通用能力。该模型在激活3B参数时,性能已能与GPT-4o和Qwen3-235B-A22B Non-Thinking相媲美。

🚀 性能提升亮点:新模型在多个关键领域展现了显著的进步,包括但不限于指令跟随、逻辑推理、文本理解、数学、科学知识、编程能力以及工具使用等方面,使其在处理复杂任务时更加得心应手。

⚙️ 技术规格与特点:该模型拥有305亿的参数总量,但实际激活的参数仅为33亿,大大提高了效率。其网络层数为48层,包含128个专家,其中8个专家被激活,并且原生支持高达262144个tokens的上下文长度,能够处理更长的文本输入。

🚫 非思考模式设计:Qwen3-30B-A3B-Instruct-2507模型专门设计为“非思考模式”,这意味着其在输出内容时不会生成“”模块,并且不再需要用户手动设置`enable_thinking=False`,简化了使用流程。

🌍 多语言与用户偏好优化:该模型显著增强了多种语言的长尾知识覆盖,并在主观和开放式任务中,能够更准确地理解用户意图,提供更贴合用户偏好的回答,从而提升了文本生成的质量和帮助性。

IT之家 7 月 30 日消息,阿里通义千问今天(7 月 30 日)在 X 平台发布推文,宣布推出 Qwen3-30B-A3B 非思考模式的更新版本,命名为 Qwen3-30B-A3B-Instruct-2507。

新模型主要提升指令跟随、逻辑推理、文本理解、数学、科学、编程和工具使用等通用能力,官方表示在激活 3B 参数的情况下,性能接近 GPT-4o 和 Qwen3-235B-A22B Non-Thinking。

IT之家援引官方博文内容,Qwen3-30B-A3B-Instruct-2507 模型的参数总量为 305 亿,但激活参数为 33 亿,非嵌入层数量为 299 亿,网络层数为 48 层,专家数为 128 个,激活专家数为 8 个,上下文长度原生支持 262144 个 tokens。

该模型仅支持非思考模式,在输出中不会生成 <think></think> 块。同时,不再需要指定 enable_thinking=False。官方表示新模型大幅增加了多种语言的长尾知识覆盖,且在主观和开放式任务中与用户偏好更加一致,能够提供更有帮助的回答和更高质量的文本生成。


Deepseek-V3-0324GPT-4o-0327Gemini-2.5-Flash 非思考Qwen3-235B-A22B 非思考Qwen3-30B-A3B 非思考Qwen3-30B-A3B-Instruct-2507
知识





MMLU-Pro81.279.881.175.269.178.4
MMLU-Redux90.491.390.689.284.189.3
GPQA68.466.978.362.954.870.4
SuperGPQA57.351.054.648.242.253.4
推理





AIME2546.626.761.624.721.661.3
HMMT2527.57.945.810.012.043.0
ZebraLogic83.452.657.937.733.290.0
LiveBench 2024112566.963.769.162.559.469.0
编程





LiveCodeBench v6 (25.02-25.05)45.235.840.132.929.043.2
MultiPL-E82.282.777.779.374.683.8
Aider-Polyglot55.145.344.059.624.435.6
对齐





IFEval82.383.984.383.283.784.7
Arena-Hard v2*45.661.958.352.024.869.0
创意写作 v381.684.984.680.468.186.0
WritingBench74.575.580.577.072.285.5
代理





BFCL-v364.766.566.168.058.665.1
TAU1-Retail49.660.3#65.265.238.359.1
TAU1-Airline32.042.8#48.032.018.040.0
TAU2-Retail71.166.7#64.364.931.657.0
TAU2-Airline36.042.0#42.536.018.038.0
TAU2-Telecom34.029.8#16.924.618.412.3
多语言





MultiIF66.570.469.470.270.867.9
MMLU-ProX75.876.278.373.265.172.0
INCLUDE80.182.183.875.667.871.9
PolyMATH32.225.541.927.023.343.1

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

通义千问 Qwen3-30B-A3B-Instruct-2507 大模型 AI 人工智能
相关文章