Cnbeta 07月22日 09:30
阿里云更新Qwen3模型 涵盖文本理解、科学等多个关键领域
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里云通义千问Qwen3大模型近日发布了旗舰版Qwen3-235B-A22B-FP8的更新版本Qwen3-235B-A22B-Instruct-2507-FP8。新模型在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多个关键领域均有显著提升。在多项权威测评中,Qwen3新模型超越了Kimi-K2、DeepSeek-V3等开源模型以及Claude-Opus4-Non-thinking等闭源模型,尤其在多语言长尾知识覆盖、主观任务处理和长文本理解方面表现突出。更新后的模型已在魔搭社区和HuggingFace开源。

✨ **通用能力显著增强**:新发布的Qwen3-235B-A22B-Instruct-2507-FP8模型在知识、数学、编程、人类偏好对齐以及Agent能力等多个方面取得了显著进步,并在多项测评中超越了包括Kimi-K2、DeepSeek-V3以及Claude-Opus4-Non-thinking在内的国内外领先模型,展现了强大的综合实力。

💡 **多语言长尾知识突破**:此次更新在多语言长尾知识的覆盖上取得了重要突破,极大地丰富了模型的知识储备,使得模型能够理解和处理更多样化、更细致的语言信息,提升了模型的全球化应用能力。

🎯 **主观任务处理与文本质量提升**:新版Qwen3模型在处理主观及开放性任务时,能够更精准地契合用户偏好,生成回复的实用性更强,文本质量也得到了显著提高,更贴近用户的真实需求。

📚 **长文本处理能力大幅提升**:模型将长文本处理能力提升至256K,显著强化了上下文理解能力,使其能够更好地应对包含大量信息和复杂逻辑的文本内容,为处理长文档、对话等场景提供了有力支持。

🌐 **全面开源,推动社区发展**:Qwen3新模型已在魔搭社区和HuggingFace上进行开源更新,这为广大开发者和研究人员提供了便捷的访问和使用途径,将有助于推动大模型技术的进一步发展和应用落地。

7月22日,阿里云通义千问Qwen大模型官方账号公布对旗舰版Qwen3模型进行了更新,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的更新版本,命名为Qwen3-235B-A22B-Instruct-2507-FP8。此次更新,涵盖指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多个关键领域。


资料显示,新的Qwen3模型通用能力显著提升。在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent 能力)等测评里,它超越了Kimi-K2、DeepSeek-V3等开源模型,以及Claude-Opus4-Non-thinking等闭源模型。


不仅如此,新版Qwen3在关键性能方面实现了进一步增强。在多语言的长尾知识覆盖上取得重要突破,极大地丰富了知识储备;在主观及开放性任务处理中,更能精准契合用户偏好,生成的回复实用性更强,文本质量也更高;长文本处理能力提升至256K,上下文理解能力得以进一步强化,能够更好地应对复杂内容。

目前,Qwen3新模型已在魔搭社区和HuggingFace上开源更新。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

通义千问 Qwen3 大模型 AI更新 开源模型
相关文章