阿里云更新Qwen3模型涵盖文本理解、科学等多个关键领域

cnBeta全文版 07月22日 10:52

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

阿里云通义千问模型近日迎来了旗舰版Qwen3的重大更新，推出了名为Qwen3-235B-A22B-Instruct-2507-FP8的新版本。此次更新在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多个核心领域均有显著进步。新模型在各项权威测评中表现优异，超越了包括Kimi-K2、DeepSeek-V3在内的多款开源模型，以及Claude-Opus4-Non-thinking等闭源模型。特别是在多语言长尾知识覆盖、主观任务的偏好契合度以及长文本处理能力方面（提升至256K），Qwen3均实现了关键突破，为用户带来更实用、高质量的交互体验。该更新版本已在魔搭社区和HuggingFace平台同步开源。

🚀 **通用能力显著增强**：新版Qwen3-235B-A22B-Instruct-2507-FP8在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等关键领域进行了全面优化，通用能力得到大幅提升。

🏆 **多项测评超越竞品**：在GQPA（知识）、AIME25（数学）、LiveCodeBench（编程）、Arena-Hard（人类偏好对齐）、BFCL（Agent 能力）等权威测评中，新版Qwen3均取得了领先地位，超越了Kimi-K2、DeepSeek-V3等开源模型以及Claude-Opus4-Non-thinking等闭源模型。

🌍 **多语言知识覆盖突破**：模型在多语言长尾知识覆盖方面取得了重要进展，极大地丰富了知识储备，能够更好地服务全球用户。

💡 **用户体验优化**：在主观和开放性任务处理中，新版Qwen3能更精准地契合用户偏好，生成回复的实用性和文本质量均有显著提高。

📚 **长文本处理能力提升**：模型支持的上下文长度提升至256K，强化了长文本的理解能力，使其能更有效地处理复杂和冗长的内容。

7月22日，阿里云通义千问Qwen大模型官方账号公布对旗舰版Qwen3模型进行了更新，推出Qwen3-235B-A22B-FP8非思考模式（Non-thinking）的更新版本，命名为Qwen3-235B-A22B-Instruct-2507-FP8。此次更新，涵盖指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多个关键领域。

资料显示，新的Qwen3模型通用能力显著提升。在GQPA（知识）、AIME25（数学）、LiveCodeBench（编程）、Arena-Hard（人类偏好对齐）、BFCL（Agent 能力）等测评里，它超越了Kimi-K2、DeepSeek-V3等开源模型，以及Claude-Opus4-Non-thinking等闭源模型。

不仅如此，新版Qwen3在关键性能方面实现了进一步增强。在多语言的长尾知识覆盖上取得重要突破，极大地丰富了知识储备；在主观及开放性任务处理中，更能精准契合用户偏好，生成的回复实用性更强，文本质量也更高；长文本处理能力提升至256K，上下文理解能力得以进一步强化，能够更好地应对复杂内容。

目前，Qwen3新模型已在魔搭社区和HuggingFace上开源更新。

查看评论

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签