PaperAgent 05月15日 04:07
DeepSeek R2意外泄露~
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek R2的信息泄露,揭示了其强大的性能和极具竞争力的价格。该模型拥有1.2T参数,78B激活,采用混合MoE架构,据称成本比GPT-4o低97.3%。它在C-Eval 2.0上达到89.7%的准确率,在COCO数据集上达到92.4%的视觉准确率。此外,DeepSeek R2在华为昇腾910B芯片上利用率高达82%。如果泄露信息属实,这将对大模型领域产生巨大影响,引发关于AI Agent设计、RAG技术以及多模态Agent系统发展的深入思考。

⚙️DeepSeek R2采用混合MoE架构,拥有1.2T参数和78B激活,显著降低了成本,据称比GPT-4o便宜97.3%,百万输入成本为0.07美元,百万输出成本为0.27美元。

📊DeepSeek R2在多个数据集上表现出色,在C-Eval 2.0上达到89.7%的准确率,展现了强大的语言理解能力;在COCO数据集上达到92.4%的准确率,突显了其卓越的视觉能力。

🚀DeepSeek R2在华为昇腾910B芯片上实现了82%的利用率,表明其在国产硬件上的优化程度较高,具有良好的部署潜力。

2025-04-27 18:56 湖北

DeepSeek R2信息遭到泄露:
有网友表示如果这些关于DeepSeek R2的信息有一半是真的,那将是震撼性的:
DeepSeek R2 更详细的信息:
更多信息:《动手设计AI Agents:CrewAI版》、《高级RAG之36技》、新技术实战:中文Lazy-GraphRAG/Manus+MCP/GRPO+Agent、大模型日报/月报、最新技术热点追踪解读(GPT4-o/数字人/MCP/Gemini 2.5 Pro)
    https://www.jiuyangongshe.com/a/1h4gq724su0

    推荐阅读


      欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

      阅读原文

      跳转微信打开

      Fish AI Reader

      Fish AI Reader

      AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

      FishAI

      FishAI

      鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

      联系邮箱 441953276@qq.com

      相关标签

      DeepSeek R2 MoE架构 大模型
      相关文章