富途牛牛头条 02月05日
最新全球模型榜單:阿里 Qwen2.5-Max超DeepSeek V3
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里通义千问团队的Qwen2.5-Max在全球大模型榜单中排名第7,在数学和编程方面排第一,处理硬提示方面排第二。该模型采用先进架构,预训练数据量大,在多方面表现优异,吸引大量关注。

💻阿里Qwen2.5-Max在全球大模型榜单中排第7,领先多种顶级模型。

🎓在数学和编程方面排名第一,处理硬提示方面排名第二。

🚀采用先进的MoE模型架构,预训练数据量超20万亿个token。

在最新的全球大模型榜单中,阿里的最新大语言模型Qwen2.5-Max排名第7,领先于DeepSeek V3、O1-Mini和Claude-3.5-Sonnet等顶级专有大语言模型,在数学和编程方面排名第一,在处理复杂任务的硬提示(hard prompts)方面排名第二。

竞赛升温!最新全球大模型榜单发布, 阿里巴巴-W (09988.HK)新模型超越DeepSeek V3。

当地时间2月4日,在全球知名的AI模型评测平台Chatbot Arena公布了最新一期的榜单。其中,阿里通义千问团队的最新大语言模型Qwen2.5-Ma取得了优异成绩,在总体排名中跻身第7,领先于DeepSeek V3、O1-Mini和Claude-3.5-Sonnet等顶级专有大语言模型。

分别看打分项,Qwen2.5-Max在技术领域表现尤为出色,在数学和编程方面排名第一,在处理复杂任务的硬提示(hard prompts)方面排名第二。

过去一年,阿里不断扩展Qwen模型家族,推出了涵盖文本、音频和视觉格式的多种规模模型,以满足全球开发者和客户日益增长的AI需求。

1月29日凌晨,阿里通义千问团队悄悄上线Qwen2.5-Max,该模型一经发布便在MMLU-Pro、LiveCodeBench、LiveBench和Arena-Hard等主要基准测试中取得领先成绩,展现出与全球顶级模型比肩的性能。

据介绍,最新的Qwen2.5-Max采用了先进的专家混合(MoE)模型架构,预训练数据量超过20万亿个token,运用监督微调(SFT)和人类反馈强化学习(RLHF)技术进行优化,在知识、编程、通用能力和人类对齐等方面表现优异。

目前,全球开发者和企业可通过阿里云的生成式AI开发平台Model Studio访问Qwen2.5-Max。

市场人士此前分析称,此前过度聚焦DeepSeek,却忽视了包括阿里通义在内的中国AI整体性追赶。行业媒体《信息平权》表示,若阿里Qwen-2.5-max这次的确性能超过V3,可以对其RL推理模型给予更大期待。

Qwen2.5-Max发布后,迅速吸引了海内外用户和开发者的大量关注。

有网友生动地概括,Qwen2.5-Max相当于“中文版的ChatGPT”,但水平要比后者“高得多”。

有用户表示,Qwen2.5-Max“重新定义”了视频生成功能,已经超过OpenAI的Sora。

甚至有用户认为,Qwen2.5-Max已经把ChatGPT、DeepSeek狠狠“拍在了沙滩上”。

还有网友制作梗图,猜测继DeepSeek-R1后,这款来自中国的强大AI模型将进一步加剧OpenAI的担忧。

编辑/ping

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

阿里Qwen2.5-Max 全球大模型榜单 数学编程 先进架构
相关文章