「全球大模型竞技场」榜单更新：DeepSeek-V2位列开源榜首

DeepSeek 2024年10月28日

「全球大模型竞技场」榜单更新：DeepSeek-V2位列开源榜首

DeepSeek-V2-0628在LMSYS组织的大模型竞技场中超越众多开源模型，荣登全球开源模型榜首。该竞技场是全球权威盲测平台，吸引众多顶尖模型参与。DeepSeek-V2-0628在各分项上表现不俗，在国内参与者中也名列前茅，且已于6月28日上线，价格具竞争力，其能力也有全面提升，并上传模型权重至相关平台。

🌐DeepSeek-V2-0628在大模型竞技场中表现卓越，超越Llama3-70B、Qwen2-72B等众多开源模型，荣获全球开源模型榜首，在多个分项排名中位居前列。

💻该模型在国内参与者中排名第二，比备受好评的Qwen2-72B开源模型更具竞争力，排名高出10名，且在代码数学推理、指令跟随等多方面能力全面提升。

💰DeepSeek-V2-0628已于2024年6月28日上线DeepSeek的API和网页端，价格极具竞争力，模型权重已上传至相关平台，持续为开源社区做出贡献。

原创深度求索 2024-07-18 20:36 北京

DeepSeek-V2-0628荣登全球开源模型榜首！

美国时间 2024年7月16日，LMSYS 组织的大模型竞技场（Chatbot Arena）更新结果发布，DeepSeek-V2-0628 超越 Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B 等开源模型，荣登全球开源模型榜首！

Chatbot Arena 是全球公认的权威大模型盲测平台，吸引了如 GPT-4、Claude、Llama、Gemini 等众多顶尖模型参与，更有 Yi-Large、Qwen、GLM等国内优秀模型同台竞技。测评方式采用人工盲测，评测者在不知晓模型名字和机构的情况下，让两个大模型回答同一个问题，选出更优质的回复。

世界级的长难问题解决能力

在Arena的分项排名中，DeepSeek-V2-0628 在各分项上也表现不俗：

难问题（Hard Prompt）世界第三

代码（Code）世界第三

长问题（Longer Query）世界第四

数学（Math）世界第七

其中，长难问题和代码领域与 GPT-4-Turbo-0409 和 Claude 3 Opus 处于同一水平。

国内模型的佼佼者

在Chatbot Arena 的国内参与者中，DeepSeek-V2-0628 同样名列前茅，排名国内所有模型第二位。与备受好评的 Qwen2-72B 开源模型相比，DeepSeek-V2-0628展现了更强的竞争力，排名高出 10 名。

值得一提的是，DeepSeek-V2-0628 已于 2024年6月28日上线 DeepSeek 的API 和网页端，价格极具竞争力。

V2-0628 更新日志

DeepSeek-V2-0628 相较于 0507 开源 Chat 版本，在代码数学推理、指令跟随、角色扮演、JSON Output 等方面能力全面提升。访问 platform.deepseek.com，接入最新版本 V2-0628 API。

拥抱开源社区，共同探索AGI

DeepSeek-V2-0628 模型权重已经上传至：https://huggingface.co/deepseek-ai/DeepSeek-V2-Chat-0628

相信我们，持续开源。我们共同的星辰大海是 AGI。

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek-V2-0628 开源模型大模型竞技场能力提升

相关文章

Meet Verba 1.0: Run State-of-the-Art RAG Locally with Ollama Integration and Open Source Models

Llama3-V: A SOTA Open-Source VLM Model Comparable performance to GPT4-V, Gemini Ultra, Claude Opus with a 100x Smaller Model

斯坦福AI项目作者对抄袭中国大模型致歉，承诺撤下相关模型

智谱 AI Open Day，低调不代表我没实力，实在是中国AI 品牌代言领军人物

Stability AI: We’re excited to announce Stable Audio Open, an open source model optimised for generating short audio samples, sound effects and produ...

Hugging Face: Welcome @CohereForAI Command-R! The top trending among over 500k open-access models! ? https://huggingface.co/CohereForAI/c4ai-comman...

科技早报｜苹果或为iPhone 17系列开发更薄机型；京东为618追加100亿投入

太惨了，33岁进入学校上班，上着上着就失业了

Meet DeepSeek-Coder-V2 by DeepSeek AI: The First Open-Source AI Model to Surpass GPT4-Turbo in Coding and Math, Supporting 338 Languages and 128K Context Length

从应届生到打工人，我总结了这份不成熟但有帮助的「职场指南」