index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html
![]()
本文详细介绍了算力中心的建设与运营,涵盖了成本构成、计算公式、收入分析以及利润评估。通过对基础设施、硬件、软件、运维等多方面成本的深入剖析,结合实际案例,为希望深耕算力和大模型产业链的从业者提供了宝贵的参考。文章还强调了在建设过程中需要关注的关键因素,并对算力投资的可行性进行了评估。
💡建设成本构成:智算中心成本主要分为三大类:基础设施建设成本、能源成本、硬件成本、软件成本、运维运营成本和其他成本。其中,硬件成本占比最高,能源成本是运营中的重要支出。
🔌电力成本考量:电力消耗是智算中心运营成本的大头,PUE值是衡量数据中心能源效率的关键指标。电费差异巨大,需要根据不同地区情况进行重点关注。
💻硬件设备选择:GPU服务器是AI训练和推理的核心计算单元,成本极高。需要考虑GPU型号、数量以及服务器的配置。存储系统、网络设备、基础设施硬件等也需仔细考量。
🏢运营模式分析:在理想情况下,算力中心可以通过市场化运营实现盈利。文章还提到了政府补贴和算力券政策,以及资产盘活等方式对投资的影响。
💰投资回报评估:文章通过案例分析,对算力投资的可行性进行了评估,并强调了在投资过程中需要注意的关键因素,例如选择合适的硬件设备和运营模式。
原创 算力百科 J 2025-06-18 06:00 贵州
“算力中心从入门到精通”应该是全网第一个系统介绍算力中心打单的材料,希望从“项目规划-资金申请-招投标运作-项

“算力中心从入门到精通”应该是全网第一个系统介绍算力中心打单的材料,希望从“项目规划-资金申请-招投标运作-项目建设-算力运营”5方面打造“算力宝典”,服务希望深耕算力和大模型产业链的从业者,磨平认知差! 经验总结于我们团队过去5年服务超百个算力规划项目和30+算力落地项目的经验。看【公式篇】之前,一定要先看前三章,这五章是循序渐进,环环相扣的,便于理解,加入星球的朋友,没有拉入VIP群的,私聊后台拉入,阅读过程中遇到的问题,随时交楼解决。咱算力中心从入门到精通,尽量用通俗易懂的语言,让大家先理解理论概念,实操项目的时候,如果遇到疑问和需要探讨的,咱也随时沟通。《带公式的excel星球下载》一、 成本分类
1.1建设成本 智算中心成本估算类似房地产成本测试,都是基于公式的,主要分三大类:基础建筑成本,IT软硬件资产,其他开支1.2基础设施建设成本 土地购置或租赁 如果新建数据中心,土地成本是重要组成部分。建筑施工 :包括土建工程、钢结构、装修等,需要满足数据中心的特殊要求(承重、层高、抗震等)。机房建设:包括防静电地板、吊顶、墙体、隔断、消防系统(气体灭火等)、安保系统(门禁、视频监控等)。电力引入和改造:高压电引入、变电站建设或改造,确保充足的电力供应。网络接入:光纤接入、运营商带宽费用。
1.3能源成本 风火水电是AIDC运营成本的大头,所以要重视,而且是线性持续性支持,所以要重视起来电力消耗 :这是智算中心运营成本中的大头,包括计算设备、制冷设备、供配电设备等的电力消耗。PUE (Power Usage Effectiveness) 是衡量数据中心能源效率的关键指标,PUE越低,能源效率越高。关于电费便宜的地方0.25元,贵的地方1.2元,差距巨大,东西南北区域属性明显,所以需要重点关注。水资源消耗:对于采用水冷系统的数据中心,水费也是一项持续支出。
1.4硬件成本 这是智算中心投资中占比最高的部分,算力设备会因为技术迭代而加速贬值,高端设备平稳运行周期就是3年左右,3~5年是生命周期的末尾,特别是特殊渠道的H/B系列的设备监控运维是一个大的挑战。特别说明:这里说的生命周期是指算力市场竞争力周期,是从芯片发布开始算起的生命周期。计算服务器 :GPU服务器 :核心计算单元,用于AI训练和推理,成本极高,是硬件投入的重中之重。需要考虑GPU型号(如NVIDIA H100, A100, B200,5090等)、数量、以及服务器的配置(CPU、内存、存储等)。CPU服务器 :用于通用计算、数据预处理、任务调度、管理等。FPGA/ASIC服务器 :针对特定AI应用定制的加速器,在某些场景下可能采用。
存储系统 :高性能存储 :如并行文件系统 (Lustre, GPFS)、NVMe-oF存储等,用于训练数据的快速读取和写入。大容量存储 :用于存储海量数据集、模型库、备份数据等。对象存储 :适用于非结构化数据和大规模数据归档。网络设备 :高性能计算网络 :如InfiniBand、RoCE (RDMA over Converged Ethernet) 等,用于服务器间低延迟、高带宽的数据传输,对大规模分布式训练至关重要。通用以太网 :用于管理网络、数据接入等。交换机、路由器、光模块、线缆等。基础设施硬件 :机柜 :用于容纳服务器、存储、网络设备。供配电系统 :包括UPS(不间断电源)、PDU(电源分配单元)、变压器、发电机等,确保电力稳定和冗余。制冷系统 :高性能计算设备发热量巨大,需要高效的制冷方案,如风冷、液冷(直接液冷、浸没式液冷等)。液冷方案初始投资较高,但PUE(电源使用效率)更优。监控系统 :环境监控(温湿度、漏水等)、安防监控。1.5软件成本 中国的软件市场反馈不好,一般公司不愿意为软件付款,大家更愿意采用开源软件搭建或者低成本采购,这里建议能用开源就用开源,或者直接裸金属租赁,减少成本投入。操作系统 :服务器操作系统,能用开源版本就选择开源版本。如Linux发行版 (Ubuntu, CentOS, Rocky Linux等)。集群管理软件 :如Slurm, Kubernetes, Mesos等,用于资源调度、任务管理、作业监控,能用开源版本就用开源版本。AI框架和库 :如TensorFlow, PyTorch, Caffe, CUDA, cuDNN等,部分为开源,但商业支持或特定版本可能产生费用。并行计算软件/中间件:如MPI库等。存储管理软件 :用于存储虚拟化、数据备份、恢复等。网络管理软件 :用于网络配置、监控和优化。安全软件 :防火墙、入侵检测/防御系统、数据加密软件等。商业软件许可:某些特定的AI应用软件、开发工具或数据库可能需要商业许可。云管理平台:如果构建私有云或混合云形态的智算中心,可能需要相应的云管理平台软件。
1.6运维运营成本 人力成本 :技术人员 :系统管理员、网络工程师、存储工程师、AI算法工程师、运维工程师等。管理人员:项目经理、运营经理等。
备品备件:服务器组件(CPU, GPU, 内存, 硬盘)、网络设备、UPS电池等。维护合同 :硬件设备原厂或第三方维保服务。培训费用 :针对运维人员和技术人员的培训。监控和管理工具费用 :持续的软件订阅或升级费用。安全审计和合规成本 :定期的安全评估和满足行业合规性要求的成本。1.7其他成本 咨询和设计费用:聘请专业咨询公司进行规划设计。项目管理费用:项目实施过程中的管理费用。许可和认证费用 :政府许可、行业认证等。保险费用 :针对设备、数据和运营风险的保险。折旧和摊销 :固定资产的价值在使用过程中的损耗。可能的融资成本 :如果项目涉及贷款,会产生利息支出。税费 :各种相关的税费。居间费用:xxx费用
二、 计算公式
以建设1000P 299台5090八卡机为例,推理算力,试算过程如下:2.1前提假设1)找空置IDC机房,资产盘活,不投入买地、机房建设、风火水电等基础设施;也就是此部分的价格不计入成本。 为什么不计算此类成本,建筑类投资已经很多,完全可以盘活,没必要去购置土地建设固定资产; 2)以电费3毛钱核算成本,且机房内的风火水电已具备,不再投入额外成本。 3)5090单机8卡最大功率5.6kw,普通的6.6kw机柜足够,基本上不涉及到机房改造成本。 4)除必要安全软件采购,其他软件均采用开源搭建,默认免费,不投入成本 5)同样这里面不考虑任何政府补贴和算了卷等费用,纯市场化因素算账2.2智算中心总投资 投资中,软件默认开源免费,硬件按照8~12个周期货价格计算,现货更贵,一般大项目都是直接找源头工厂生产或者订货。
2.3算力收入分析 收入计算,5090 8卡机 投资299台 6k 60个月有人包销,且上线即满租的理想情况。根据
4090的历史来看,目前投资5090 ,参考4090的生命周期,风险较小,性价比较高;目前5090集群稳定性还需要技术验证和时间成熟。
2.4电费成本电费按照3毛,很多地方电费是2.5毛左右,这里统一计算60个月都是3毛
2.5经营成本这里考虑3个运维人员驻场,且每人年薪15w;
2.6项目投资现金表未考虑财务成本,以平台公司自有资金计算;
2.7利润分析表 按照这个试算,市场化是可以盈利的,至少可以打平!算力投资依然是一个比较好的投资标的,但是要会投,选对方式方法,跨界的投资人,基本上需要交续费的,亏损的,烂尾的!
三、 总结说明
1)一般情况下,1000P以上算力中心,本地会有政府补贴和算力券政策享受,比例为15~30%之间,这部分钱成为额外利润,补贴政策以当地为准。2)IDC机房,目前地平台公司都有空置情况,可以“资产盘活”的模式去找平台公司和政府聊;3)1000P投资,投资5090依然是性价比最高的方案,目前技术待成熟。4)这只是一种理想情况试算,其他费用都没考虑,供大家参考学习。全国首个算力和大模型工程专属服务IP算力宝典,第一章、算力中心从入门到精通【概述篇】算力宝典,第二章 算力中心从入门到精通【模式篇】算力宝典,第三章、算力中心从入门到精通【方案篇】 欢迎加入社群↓








阅读原文
跳转微信打开