阿里千问近日更新了其开源模型Qwen3-235B-A22B-Instruct-2507-FP8。新版本在通用能力上实现了显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程和工具使用等方面。在多项公开测评中,Qwen3-235B-A22B-Instruct-2507-FP8表现优异,超越了包括Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。此次更新还特别增强了模型在多语言长尾知识覆盖、用户偏好契合度以及长文本理解能力(提升至256K)方面的表现,目前已在魔搭社区和HuggingFace上开源,引发开发者社区广泛关注。
🚀 **通用能力全面升级**:新发布的Qwen3-235B-A22B-Instruct-2507-FP8模型在指令遵循、逻辑推理、文本理解、数学、科学、编程以及工具使用等多个维度展现出显著的提升,为用户提供更强大、更全面的AI能力支持。
🏆 **多项测评表现亮眼**:该模型在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多权威测评中均取得了优异成绩,部分测评结果甚至超越了Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先的闭源模型。
🌐 **长尾知识与多语言能力增强**:模型在多语言的长尾知识覆盖方面取得了显著进步,能够更好地理解和处理不同语言环境下细致的知识点,提升了模型的全球适用性。
💬 **用户偏好契合度与长文本处理优化**:新版本显著增强了模型对用户偏好的契合能力,尤其在主观和开放性任务中能提供更符合用户需求的回复和更高质量的文本输出。同时,长文本处理能力提升至256K,极大地增强了模型的上下文理解能力,能够处理更长的输入信息。
🎁 **已在社区开源**:此次更新的Qwen3模型已在魔搭社区和HuggingFace上进行了开源,欢迎广大开发者体验和使用,共同推动AI技术的发展。
深夜,开源模型 Qwen3 又更新升级了!阿里千问宣布推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为 Qwen3-235B-A22B-Instruct-2507-FP8。链接:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8据介绍,新的 Qwen3 模型,通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面。公开测评得分显示(图2),Qwen3-235B-A22B-Instruct-2507-FP8 在 GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent 能力)等众多测评中表现出色,甚至了超过 Kimi-K2、DeepSeek-V3 等顶级开源模型以及 Claude-Opus4-Non-thinking 等领先闭源模型(详见图 2)。此外,本次更新的 Qwen3 模型,还增强了以下关键性能:1、在多语言的长尾知识覆盖方面,模型取得显著进步。2、在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。3、长文本提升到 256K,上下文理解能力进一步增强。目前,该模型已经在海外引起了开发者社区热议与讨论(图 4、图 5)。新 Qwen3 模型已在魔搭社区和 HuggingFace 上开源更新,欢迎开发者们体验。
文章原文