DeepSeek R2意外泄露~

PaperAgent 05月08日 15:22

DeepSeek R2意外泄露~

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

DeepSeek R2模型的信息引发广泛关注，据称该模型拥有1.2T参数和78B激活参数，采用混合MoE架构，并以极具竞争力的价格提供服务。其在C-Eval 2.0和COCO数据集上的出色表现，以及在华为昇腾910B芯片上的高利用率，都预示着其强大的性能。文章还提及了关于AI Agents和RAG技术的最新进展，以及相关的大模型技术热点追踪，为读者提供了丰富的技术参考。

💡DeepSeek R2的核心参数：该模型拥有1.2T参数，78B激活参数，采用了混合MoE架构，这使得其在性能和效率上具有优势。

💰价格优势：DeepSeek R2的定价极具竞争力，每百万输入成本仅为0.07美元，每百万输出成本为0.27美元，与GPT-4o相比，价格优势明显。

📊性能表现：在C-Eval 2.0上，DeepSeek R2的准确率达到了89.7%，在COCO数据集上达到了92.4%的准确率，展现了其强大的语言理解和视觉能力。

💻硬件利用率：DeepSeek R2在华为昇腾910B芯片上的利用率达到了82%，表明该模型在国产算力平台上具有良好的运行效率。

📚相关技术与资源：文章还推荐了关于AI Agents、RAG技术以及大模型技术热点的相关文章，为读者提供了深入了解这些技术领域的资源。

2025-04-27 18:56 湖北

DeepSeek R2信息遭到泄露：

1.2T参数，78B激活，混合MoE架构

比GPT-4o便宜97.3%（每百万输入0.07美元，每百万输出0.27美元）

5.2PB训练数据，在C-Eval 2.0上达到89.7%的准确率

更好的视觉能力，在COCO数据集上达到92.4%的准确率

在华为昇腾910B芯片上达到82%的利用率

有网友表示如果这些关于DeepSeek R2的信息有一半是真的，那将是震撼性的：

DeepSeek R2 更详细的信息：

更多信息：《动手设计AI Agents：CrewAI版》、《高级RAG之36技》、新技术实战：中文Lazy-GraphRAG/Manus+MCP/GRPO+Agent、大模型日报/月报、最新技术热点追踪解读（GPT4-o/数字人/MCP/Gemini 2.5 Pro）

https://www.jiuyangongshe.com/a/1h4gq724su0

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签