阿里云更新Qwen3模型涵盖文本理解、科学等多个关键领域

Cnbeta 07月22日 09:30

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

阿里云通义千问Qwen3大模型近日发布了旗舰版Qwen3-235B-A22B-FP8的更新版本Qwen3-235B-A22B-Instruct-2507-FP8。新模型在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多个关键领域均有显著提升。在多项权威测评中，Qwen3新模型超越了Kimi-K2、DeepSeek-V3等开源模型以及Claude-Opus4-Non-thinking等闭源模型，尤其在多语言长尾知识覆盖、主观任务处理和长文本理解方面表现突出。更新后的模型已在魔搭社区和HuggingFace开源。

✨ **通用能力显著增强**：新发布的Qwen3-235B-A22B-Instruct-2507-FP8模型在知识、数学、编程、人类偏好对齐以及Agent能力等多个方面取得了显著进步，并在多项测评中超越了包括Kimi-K2、DeepSeek-V3以及Claude-Opus4-Non-thinking在内的国内外领先模型，展现了强大的综合实力。

💡 **多语言长尾知识突破**：此次更新在多语言长尾知识的覆盖上取得了重要突破，极大地丰富了模型的知识储备，使得模型能够理解和处理更多样化、更细致的语言信息，提升了模型的全球化应用能力。

🎯 **主观任务处理与文本质量提升**：新版Qwen3模型在处理主观及开放性任务时，能够更精准地契合用户偏好，生成回复的实用性更强，文本质量也得到了显著提高，更贴近用户的真实需求。

📚 **长文本处理能力大幅提升**：模型将长文本处理能力提升至256K，显著强化了上下文理解能力，使其能够更好地应对包含大量信息和复杂逻辑的文本内容，为处理长文档、对话等场景提供了有力支持。

🌐 **全面开源，推动社区发展**：Qwen3新模型已在魔搭社区和HuggingFace上进行开源更新，这为广大开发者和研究人员提供了便捷的访问和使用途径，将有助于推动大模型技术的进一步发展和应用落地。

7月22日，阿里云通义千问Qwen大模型官方账号公布对旗舰版Qwen3模型进行了更新，推出Qwen3-235B-A22B-FP8非思考模式（Non-thinking）的更新版本，命名为Qwen3-235B-A22B-Instruct-2507-FP8。此次更新，涵盖指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多个关键领域。

资料显示，新的Qwen3模型通用能力显著提升。在GQPA（知识）、AIME25（数学）、LiveCodeBench（编程）、Arena-Hard（人类偏好对齐）、BFCL（Agent 能力）等测评里，它超越了Kimi-K2、DeepSeek-V3等开源模型，以及Claude-Opus4-Non-thinking等闭源模型。

不仅如此，新版Qwen3在关键性能方面实现了进一步增强。在多语言的长尾知识覆盖上取得重要突破，极大地丰富了知识储备；在主观及开放性任务处理中，更能精准契合用户偏好，生成的回复实用性更强，文本质量也更高；长文本处理能力提升至256K，上下文理解能力得以进一步强化，能够更好地应对复杂内容。

目前，Qwen3新模型已在魔搭社区和HuggingFace上开源更新。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签