虎嗅 04月01日 14:47
阿里秘密研发新模型将发布,影响力指标成最重要考核
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里将于2025年4月发布新模型Qwen3,距Qwen2.5发布约七个月。DeepSeek-R1的出现促使阿里将重心向模型推理能力倾斜。阿里内部将“模型影响力”作为最重要的考核维度,包括衍生模型量和开发者社区受欢迎度。Qwen系列模型下载量已超2亿。Qwen3将采取“多尺寸”策略,并伴随史上最大规模校招。阿里更倾向于招聘“AI原生”人才,以更好地适应智驾、AI Agent等新兴场景。

🚀 Qwen3发布时间:阿里计划在2025年4月第二周发布Qwen3,距离Qwen2.5发布大约七个月。

💡 策略调整:DeepSeek-R1的发布促使阿里基础模型团队将策略中心向模型的推理能力倾斜,DeepSeek-R1成为新的对标模型。

🏆 考核指标:阿里基础模型团队最重要的考核维度是“模型影响力”,包括衍生模型量和开发者社区的受欢迎程度。

🌐 开发者生态:Qwen系列模型在开发者社区的下载量超过2亿,阿里高度重视在全球开发者中的模型影响力。

🔍 未来布局:Qwen3将采取“多尺寸”策略,以更好地契合智驾、AI Agent、AI硬件等场景,并开启史上最大规模校招,更看重“AI原生”人才。

虎嗅独家获悉,阿里即将在2025年4月第二周发布新模型Qwen3,这将是阿里在2025年上半年最重要的模型产品,距离2024年9月阿里在云栖大会上发布Qwen2.5过去了大约七个月的时间。

据虎嗅独家了解,在2024年发布Qwen2.5后,阿里云内部的基础模型团队已经开始推动Qwen3相关项目。但2025年初DeepSeek的火爆,改变了团队的部分思路与重心。“2024年四季度,圈内已经意识到模型的推理能力很重要,但还不能说是最重要的方向,DeepSeek火爆后,推理能力已经成为绕不开的关键能力。”知情人士告诉虎嗅,DeepSeek-R1发布后,阿里云基础模型团队把策略中心进一步向模型的推理能力倾斜。

值得注意的是,在2024年下半年,阿里云基础模型团队对标的竞品模型主要是OpenAI的o1,而在DeepSeek-R1发布后,DeepSeek-R1已经成为了另一个主要对标模型。

虎嗅独家获悉,在阿里内部,基础模型团队最重要的考核维度是“模型影响力”。在内部,高层希望团队可以在业内成功塑造“最强模型”的心智。阿里集团CEO吴泳铭同时兼任阿里云CEO,据悉吴泳铭频繁参与到基础模型团队的业务沟通之中,并密切留意模型团队的各种进展。

两个具体的维度,被视为阿里基础模型团队的考核点:其一是衍生模型量,其二是在开发者社区的受欢迎度。

由于阿里采取模型开源策略,基于Qwen开源模型的衍生模型总量,被视为一个关键指标。截至目前,这一数据已经超过10万。而在开发者社区的欢迎度,阿里会考虑多个具体指标,比如开源模型下载量等。虎嗅获悉,2024年Qwen系列模型在开发者社区的下载量超过了2亿。

“在开发者社区之中,一个模型的影响力,主要有两个维度:一个是下载量,一个是衍生模型数。基于下载的开源模型,微调而成新的衍生模型后,需要重新上传至开发者社区。所以这两个维度可以比较好地反映一个开源模型的人气。”一位知情人士告诉虎嗅,在阿里内部针对全球开发者的模型影响力相关心智指标,从2024年开始就被高度重视,这和吴泳铭等技术出身的高管熟稔技术圈文化有关。

虎嗅另外独家获悉,2025年阿里模型团队也意识到了诸如智驾、AI Agent、AI硬件等机会风口的存在。为了更好地契合这些场景,基础模型团队依然会采取“多尺寸”策略。2024年发布的Qwen2系列,总共发布了7种不同的模型尺寸,而即将发布的Qwen3尺寸类型可能会更多。

值得注意的是,伴随Qwen3发布,阿里正在开启史上最大规模的校招,而虎嗅获悉,校招的HC之中涉及到基础模型团队的岗位量也达到史上最高。和以往不同的是,目前基础模型团队在招人过程中,更看重人才的“AI原生”,也就是说更希望引入一开始接触的就是大语言模型的人才,而非传统的NLP人才()。

文章标题:阿里秘密研发新模型将发布,影响力指标成最重要考核

文章链接:https://www.huxiu.com/article/4187485.html

阅读原文:阿里秘密研发新模型将发布,影响力指标成最重要考核_虎嗅网

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Qwen3 阿里 大模型 模型影响力 开发者社区
相关文章