DeepSeek 2024年10月28日
「全球大模型竞技场」更新:DeepSeek-V2.5上榜,领跑国内模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek-V2.5 是一款融合通用与代码能力的全新模型,在 LMSYS 组织的全球大模型竞技场(ChatBotArena)中,DeepSeek-V2.5 排名位列国内大模型第一,开源超越国内最强闭源模型,并在 8 个单项能力上均领跑国内模型。DeepSeek-V2.5 在 ChatBotArena 的各个维度都获得了不错的排名,均位列该榜单中国内第一。V2.5 相比 V2 能力全面提升,在总排名和所有分项排名上均提升。在 9 月 15 日中文分项更新之后,DeepSeek-V2.5 位列世界第二,中国第一,重新让中文榜单的前三中有了中国模型的名字。

🚀 DeepSeek-V2.5 在 LMSYS ChatBotArena 中取得了优异成绩,排名位列国内大模型第一,开源超越国内最强闭源模型,并在 8 个单项能力上均领跑国内模型。

🏆 DeepSeek-V2.5 在 ChatBotArena 的各个维度都获得了不错的排名,均位列该榜单中国内第一,展现了其综合实力。

📈 相比合并前的两个模型(DeepSeek-V2-0628 和 DeepSeek-Coder-V2-0724),V2.5 在总排名和所有分项排名上均提升,说明模型合并后能力得到了进一步提升。

🇨🇳 在 9 月 15 日中文分项更新之后,DeepSeek-V2.5 位列世界第二,中国第一,重新让中文榜单的前三中有了中国模型的名字,体现了其在中文理解和生成方面的出色表现。

🔗 DeepSeek-V2.5 模型已开源至 Huggingface,方便开发者进行研究和应用。

🎉 DeepSeek-V2.5 的出色成绩再次证明了国产大模型的强大实力,为中国人工智能发展注入新的活力。

原创 深度求索 2024-09-18 20:06 北京

V2.5创LMSYS ChatBotArena有史以来国产模型最高分

月初,我们发布并开源了 DeepSeek-V2.5,一个融合通用与代码能力的全新模型。

近日,LMSYS 组织的全球大模型竞技场(ChatBotArena)更新结果发布,DeepSeek-V2.5 排名位列国内大模型第一,开源超越国内最强闭源模型(Yi-Large-Preview, Qwen-Plus-0828, GLM-4-0520),并在8个单项能力上均领跑国内模型。

Model绿柱为国内模型,蓝柱为海外模型

八项能力领跑国产模型

在 Arena 的分项排名中,DeepSeek-V2.5 在诸多分项上创了国内模型的历史最好成绩

并且,DeepSeek-V2.5 模型能力均衡,在 ChatBotArena 的各个维度都获得了不错的排名,均位列该榜单中国内第一。

V2.5 相比 V2 能力全面提升

相比合并前的两个模型(DeepSeek-V2-0628 和 DeepSeek-Coder-V2-0724),V2.5 在总排名和所有分项排名上均提升,下表展示了模型合并后在ChatBotArena 榜单各项能力的排名:

最懂中文的是中国模型?

业内一直有一句名言“国内模型更懂中文”,但从 ChatBotArena 最近一个月的中文分项来看,国外模型牢牢占据了中文榜前三。在9月15日中文分项更新之后,DeepSeek-V2.5 位列世界第二,中国第一,Qwen-plus-0828 紧随其后,重新让中文榜单的前三中有了中国模型的名字。

DeepSeek-V2.5 模型已开源至 Huggingface:https://huggingface.co/deepseek-ai/DeepSeek-V2.5

——end——

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek-V2.5 LMSYS ChatBotArena 大模型 开源 中文榜单
相关文章