DeepSeek 04月09日
「全球大模型竞技场」榜单更新:DeepSeek-V2位列开源榜首
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek-V2-0628在LMSYS组织的大模型竞技场中超越众多开源模型,荣登全球开源模型榜首。该模型在各分项上表现不俗,在国内参与者中也名列前茅,且已于6月28日上线,价格具竞争力,能力全面提升。

🦘DeepSeek-V2-0628荣登全球开源模型榜首,超越多种模型。

🎯在Chatbot Arena分项排名中表现出色,多个领域位居前列。

💪DeepSeek-V2-0628在国内排名第二,竞争力强,价格有优势。

📈相较于0507版本,在多方面能力全面提升并已上线。

原创 深度求索 2024-07-18 20:36 北京

DeepSeek-V2-0628荣登全球开源模型榜首!

美国时间 2024年7月16日,LMSYS 组织的大模型竞技场(Chatbot Arena)更新结果发布,DeepSeek-V2-0628 超越 Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B 等开源模型,荣登全球开源模型榜首



Chatbot Arena 是全球公认的权威大模型盲测平台,吸引了如 GPT-4、Claude、Llama、Gemini 等众多顶尖模型参与,更有 Yi-Large、Qwen、GLM等国内优秀模型同台竞技。测评方式采用人工盲测,评测者在不知晓模型名字和机构的情况下,让两个大模型回答同一个问题,选出更优质的回复。

世界级的长难问题解决能力

在Arena的分项排名中,DeepSeek-V2-0628 在各分项上也表现不俗:

其中,长难问题和代码领域与 GPT-4-Turbo-0409 和 Claude 3 Opus 处于同一水平。

国内模型的佼佼者

在Chatbot Arena 的国内参与者中,DeepSeek-V2-0628 同样名列前茅,排名国内所有模型第二位。与备受好评的 Qwen2-72B 开源模型相比,DeepSeek-V2-0628展现了更强的竞争力,排名高出 10 名。

值得一提的是,DeepSeek-V2-0628 已于 2024年6月28日上线 DeepSeek 的API 和网页端,价格极具竞争力。


V2-0628 更新日志

DeepSeek-V2-0628 相较于 0507 开源 Chat 版本,在代码数学推理、指令跟随、角色扮演、JSON Output 等方面能力全面提升。访问 platform.deepseek.com,接入最新版本 V2-0628 API。

拥抱开源社区,共同探索AGI

DeepSeek-V2-0628 模型权重已经上传至:https://huggingface.co/deepseek-ai/DeepSeek-V2-Chat-0628

相信我们,持续开源。我们共同的星辰大海是 AGI。



跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek-V2-0628 全球开源模型 大模型竞技场 AGI
相关文章