掘金 人工智能 9小时前
刚刚!Qwen3深夜升级,碾压Kimi K2和DeepSeek V3
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

通义千问旗舰版Qwen3模型迎来重要更新,推出了Qwen3-235B-A22B-Instruct-2507-FP8版本。新模型在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等通用能力上均有显著提升,并在多项权威测评中超越了包括Kimi-K2、DeepSeek-V3在内的顶级开源模型以及Claude-Opus4-Non-thinking等闭源模型。此次更新还特别增强了模型在多语言长尾知识覆盖、用户偏好契合度以及长文本处理能力,上下文长度扩展至256K。阿里官方也提供了推荐配置以优化模型性能,该新模型已在魔搭社区和Hugging Face上开源。

🌟 **通用能力大幅跃升:** 新发布的Qwen3-235B-A22B-Instruct-2507-FP8模型在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面实现了显著的性能提升,并在GQPA、AIME25、LiveCodeBench、Arena-Hard、BFCL等多个关键测评指标上表现优异,超越了多款顶尖的开源及闭源模型。

📈 **关键性能增强:** 模型在多语言长尾知识的覆盖上取得了显著进展,同时大幅增强了对用户偏好的契合能力,能够提供更具价值的回复和更高质量的文本生成。此外,模型的长文本处理能力得到加强,上下文长度扩展至256K,进一步提升了其理解和处理复杂信息的能力。

🔧 **最佳性能配置建议:** 为确保最佳使用体验,阿里官方推荐了特定的采样参数(Temperature=0.7、TopP=0.8、TopK=20、MinP=0)和输出长度(16,384Token)。同时,针对数学问题和多项选择题,提供了规范的提示词格式建议,以引导模型进行准确和结构化的输出。

🚀 **开源与可用性:** Qwen3新模型现已在魔搭社区和Hugging Face平台上公开开源,用户可以通过指定链接访问和下载,为AI研究和应用提供了强大的新工具。

刚刚,Qwen3迎来惊喜升级!

通义千问更新了旗舰版Qwen3模型,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的更新版本,命名为:

Qwen3-235B-A22B-Instruct-2507-FP8。

新的Qwen3模型,通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面。

在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。

此外,刚刚更新的Qwen3模型,还增强了以下关键性能:
· 在多语言的长尾知识覆盖方面,模型取得显著进步。
· 在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。
· 长文本提升到256K,上下文理解能力进一步增强。

为获得最佳性能,阿里也贴心地为大家准备了推荐配置:
· 采样参数:Temperature=0.7、TopP=0.8、TopK=20、MinP=0 · 合适的输出长度:输出长度为16,384Token,这对于指令模型来说已经足够
· 规范输出格式:
数学问题:在提示词中加入「请一步一步推理,并将最终答案放入\boxed{}中。」
多项选择题:在提示词中添加以下JSON结构以规范回复格式:「请在answer字段中仅填写选项字母,例如:"answer": "C"。」

注意:此模型仅支持非思考模式,在输出中不会生成块。同时,不再需要指定enable_thinking=False。

目前,Qwen3新模型已在魔搭社区和Hugging Face上开源:
huggingface.co/Qwen/Qwen3-…

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

通义千问 Qwen3 AI模型 大模型 语言模型
相关文章