阿里云通义千问模型近日迎来了旗舰版Qwen3的重大更新,推出了名为Qwen3-235B-A22B-Instruct-2507-FP8的新版本。此次更新在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多个核心领域均有显著进步。新模型在各项权威测评中表现优异,超越了包括Kimi-K2、DeepSeek-V3在内的多款开源模型,以及Claude-Opus4-Non-thinking等闭源模型。特别是在多语言长尾知识覆盖、主观任务的偏好契合度以及长文本处理能力方面(提升至256K),Qwen3均实现了关键突破,为用户带来更实用、高质量的交互体验。该更新版本已在魔搭社区和HuggingFace平台同步开源。
🚀 **通用能力显著增强**:新版Qwen3-235B-A22B-Instruct-2507-FP8在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等关键领域进行了全面优化,通用能力得到大幅提升。
🏆 **多项测评超越竞品**:在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent 能力)等权威测评中,新版Qwen3均取得了领先地位,超越了Kimi-K2、DeepSeek-V3等开源模型以及Claude-Opus4-Non-thinking等闭源模型。
🌍 **多语言知识覆盖突破**:模型在多语言长尾知识覆盖方面取得了重要进展,极大地丰富了知识储备,能够更好地服务全球用户。
💡 **用户体验优化**:在主观和开放性任务处理中,新版Qwen3能更精准地契合用户偏好,生成回复的实用性和文本质量均有显著提高。
📚 **长文本处理能力提升**:模型支持的上下文长度提升至256K,强化了长文本的理解能力,使其能更有效地处理复杂和冗长的内容。
7月22日,阿里云通义千问Qwen大模型官方账号公布对旗舰版Qwen3模型进行了更新,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的更新版本,命名为Qwen3-235B-A22B-Instruct-2507-FP8。此次更新,涵盖指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多个关键领域。

资料显示,新的Qwen3模型通用能力显著提升。在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent 能力)等测评里,它超越了Kimi-K2、DeepSeek-V3等开源模型,以及Claude-Opus4-Non-thinking等闭源模型。

不仅如此,新版Qwen3在关键性能方面实现了进一步增强。在多语言的长尾知识覆盖上取得重要突破,极大地丰富了知识储备;在主观及开放性任务处理中,更能精准契合用户偏好,生成的回复实用性更强,文本质量也更高;长文本处理能力提升至256K,上下文理解能力得以进一步强化,能够更好地应对复杂内容。
目前,Qwen3新模型已在魔搭社区和HuggingFace上开源更新。
查看评论