特大号 03月08日 20:48
太震撼!DeepSeek用226台H800服务器,日赚409万!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek近日披露了其V3/R1推理系统的优化方案,重点在于通过优化架构提升吞吐量、降低延迟并优化GPU占用率。文章详细介绍了大规模跨节点专家并行、计算-通信重叠优化以及多级负载均衡策略这三大核心技术。同时,DeepSeek还公开了基于线上系统实测的投入产出比数据,展示了在优化架构下,推理系统所能产生的巨大收益。数据显示,DeepSeek V3和R1推理服务在24小时内平均占用226.75个GPU节点,总成本约为8.7万美元,而理论总收入高达56.2万美元,成本利润率高达545%,为算力生意提供了极具参考价值的ROI天花板。

🚀**优化架构提升性能**: DeepSeek通过大规模跨节点专家并行、计算-通信重叠优化以及多级负载均衡策略,显著提升了推理系统的吞吐量和降低了延迟,同时优化了GPU的占用率。

💰**成本收益比惊人**: DeepSeek公开的线上系统实测数据显示,其V3和R1推理服务在24小时内,成本约为8.7万美元,而理论总收入高达56.2万美元,成本利润率高达545%。

📊**GPU资源占用情况**: 在过去24小时内,DeepSeek V3 和 R1 推理服务峰值占用278个节点,平均占用 226.75个节点(每节点为 8个H800GPU)。

💡**Token吞吐量分析**: 平均每台H800服务器的吞吐量为:73.7k tokens/s (输入)、14.8k tokens/s(输出),展示了DeepSeek优化后的推理系统的高性能。

原创 特大妹 2025-03-01 20:02 北京

大周末的,DeepSeek悄么声放了个大招。

他们知乎官号发了一篇雄文,披露了【如何对DeepSeek V3/R1的推理系统进行优化】,文章有2大核心内容↓

一、如何通过优化架构,让模型推理获得更大的吞吐和更低的延迟

简单概括就是三板斧↓

① 大规模跨节点专家并行

② 计算-通信重叠优化

③ 多级负载均衡策略

前两步可以提升吞吐、降低延迟,而第三步用于优化GPU的占用率。

DeepSeek在线推理系统架构图

二、测算一下:在这种优化架构下,按照目前DeepSeek官方的收费策略,一天能赚多少钱

DeepSeek在文中给出了这样一个典型“优化推理”系统的投入产出比,也就是说,成本多少钱,能赚多少钱。

这些数据是基于正在运营的线上系统实测得来的,可参考性极高。

看第一张图,最近24小时内(2月27日12点-2月28日12点),DeepSeek V3 和 R1 推理服务占用GPU节点总和↓


峰值占用为278个节点,平均占用 226.75个节点(每节点为 8个H800GPU)。

如果按每GPU租金2美金/小时来计算,总成本为2×226.75×8×24=$87,072/天。

而在对应的时间内,产生的Tokens数量和收入是多少呢?

总输入:608B(其中56.3%命中硬盘中的KV Cache);总输出:168B

平均每台H800服务器的吞吐量为:73.7k tokens/s (输入)、14.8k tokens/s(输出)。

不得不说,DeepSeek优化完的推理系统性能真是高啊!

各家一体机厂商可以自己比一比,只有几K甚至几百tokens的单机还好意思拿出来么?

接下就是收入估算,在这24小时里,理论总收入是$562027(折合人民币约409万),成本利润率高达545%!

(当然DeepSeek官方也说了,实际收入没有这么多,因为web版目前免费、API夜间还打折,还有V3比R1便宜)

但是,这个收益已经足够震撼!

只能说,DeepSeek真太牛了。

有圈内人士说,DeepSeek这个发布,为实际项目带来了极大的参考价值!

就是别瞎来!

因为,接下来对算力黄牛来说,挑战来了——

这个数字几乎是算力生意ROI的天花板,大家再画饼的时候,不要要超过这个数哦,否则这饼就不圆了。



详细文章,请移步知乎阅读原文

《DeepSeek-V3 / R1 推理系统概览》

原文链接:https://zhuanlan.zhihu.com/p/27181462601


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek 推理系统 性能优化 成本收益 GPU算力
相关文章