刚刚！Qwen3深夜升级，碾压Kimi K2和DeepSeek V3

掘金人工智能 9小时前

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

通义千问旗舰版Qwen3模型迎来重要更新，推出了Qwen3-235B-A22B-Instruct-2507-FP8版本。新模型在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等通用能力上均有显著提升，并在多项权威测评中超越了包括Kimi-K2、DeepSeek-V3在内的顶级开源模型以及Claude-Opus4-Non-thinking等闭源模型。此次更新还特别增强了模型在多语言长尾知识覆盖、用户偏好契合度以及长文本处理能力，上下文长度扩展至256K。阿里官方也提供了推荐配置以优化模型性能，该新模型已在魔搭社区和Hugging Face上开源。

🌟 **通用能力大幅跃升：** 新发布的Qwen3-235B-A22B-Instruct-2507-FP8模型在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面实现了显著的性能提升，并在GQPA、AIME25、LiveCodeBench、Arena-Hard、BFCL等多个关键测评指标上表现优异，超越了多款顶尖的开源及闭源模型。

📈 **关键性能增强：** 模型在多语言长尾知识的覆盖上取得了显著进展，同时大幅增强了对用户偏好的契合能力，能够提供更具价值的回复和更高质量的文本生成。此外，模型的长文本处理能力得到加强，上下文长度扩展至256K，进一步提升了其理解和处理复杂信息的能力。

🔧 **最佳性能配置建议：** 为确保最佳使用体验，阿里官方推荐了特定的采样参数（Temperature=0.7、TopP=0.8、TopK=20、MinP=0）和输出长度（16,384Token）。同时，针对数学问题和多项选择题，提供了规范的提示词格式建议，以引导模型进行准确和结构化的输出。

🚀 **开源与可用性：** Qwen3新模型现已在魔搭社区和Hugging Face平台上公开开源，用户可以通过指定链接访问和下载，为AI研究和应用提供了强大的新工具。

刚刚，Qwen3迎来惊喜升级！

通义千问更新了旗舰版Qwen3模型，推出Qwen3-235B-A22B-FP8非思考模式（Non-thinking）的更新版本，命名为：

Qwen3-235B-A22B-Instruct-2507-FP8。

新的Qwen3模型，通用能力显著提升，包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面。

在GQPA（知识）、AIME25（数学）、LiveCodeBench（编程）、Arena-Hard（人类偏好对齐）、BFCL（Agent能力）等众多测评中表现出色，超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。

此外，刚刚更新的Qwen3模型，还增强了以下关键性能：
· 在多语言的长尾知识覆盖方面，模型取得显著进步。
· 在主观及开放性任务中，模型显著增强了对用户偏好的契合能力，能够提供更有用的回复，生成更高质量的文本。
· 长文本提升到256K，上下文理解能力进一步增强。

为获得最佳性能，阿里也贴心地为大家准备了推荐配置：
· 采样参数：Temperature=0.7、TopP=0.8、TopK=20、MinP=0 · 合适的输出长度：输出长度为16,384Token，这对于指令模型来说已经足够
· 规范输出格式：
数学问题：在提示词中加入「请一步一步推理，并将最终答案放入\boxed{}中。」
多项选择题：在提示词中添加以下JSON结构以规范回复格式：「请在answer字段中仅填写选项字母，例如："answer": "C"。」

注意：此模型仅支持非思考模式，在输出中不会生成块。同时，不再需要指定enable_thinking=False。

目前，Qwen3新模型已在魔搭社区和Hugging Face上开源：
huggingface.co/Qwen/Qwen3-…

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签