近期大厂算力需求方向：FP4算力、低成本柜电、移机指定AIDC等

原创算力百科 J 2025-07-07 06:01 贵州

1.FP4算力需求：针对英伟达最新Blackwell架构算力，有序按需提供算力；

2.低成本柜电需求：只要求靠近人口密集城市，且提供低成本柜电资源；

3.设备移机需求：大厂接到大量的移机需求，针对央国企和一些智算项目应付检查的需求

随着人工智能技术的飞速发展，特别是大语言模型的深入应用，算力已成为互联网及科技企业的核心战略资源。近期，市场对算力的需求不再是单一的规模扩张，而是呈现出更加精细化、多元化和场景化的新趋势。各大互联网厂商在算力采购、部署和运维上，正展现出三大显著的新方向：对前沿FP4算力的极致追求、对低成本推理服务的迫切需求，以及由合规与项目驱动的灵活设备移机。

Pangu 员工自曝：套壳、续训、洗水印，hw基于qwen继续训练被证实之后，截止目前，用国产算力训练大模型的公司“全部暴雷”，至此，国内所有到大模型0到1阶段的训练全部依赖N卡，1到100的增量训练可以依靠国产卡继续训练，已经是非常大的进步啦！

所以N卡是目前国内训练算力唯一来源，国产卡目前正在努力追赶，尚没有0到1完成大模型训练的成功案例！

追求极致FP4性能，对Blackwell架构及FP4前沿算力的渴求

应对下半年R2等新模型发布，在模型训练的“军备竞赛”中，更高的算力效率和更低的单次训练成本是永恒的追求。随着英伟达最新Blackwell架构的发布，互联网大厂的目光迅速聚焦于其带来的革命性性能提升，尤其是对FP4（4位浮点数）数据格式的支持。

核心驱动力：大模型参数量和训练数据量呈指数级增长，传统的FP16/FP8已难以在成本和效率之间达到最优平衡。FP4格式能在大幅降低显存占用和通信带宽的同时，通过先进的硬件和软件协同设计，保持模型训练和推理的精度，实现训练速度和推理吞吐量的翻倍增长。

NVIDIA B200：作为旗舰训练芯片，是头部大厂进行下一代万亿级模型训练的首选，需求量巨大，但供应紧张。

NVIDIA B20/B40：面向更广泛的企业和推理市场，提供了更灵活的配置和更高的能效比，适合模型精调、行业模型训练及高通量推理场景。

NVIDIA RTX 5090 ：虽然定位消费级，但凭借其强大的性能和相对较低的获取门槛，将被大量用于模型开发、算法验证和中小型推理集群，成为“平民法拉利”。

大厂在此阶段的需求呈现出“有序规划、按需供给”的特点。它们不再是盲目囤积，而是根据自身模型的研发路线图和业务上线节奏，与核心供应商进行深度洽谈，寻求长期的、可预测的供应保障。这要求算力供应商不仅要有稳定的货源渠道，更需要具备强大的供应链整合与交付能力。这里特别注意，自用算力只跟稳定的大供应直签，小供应商没机会！

人口密集区的低成本柜电与推理算力资源的整合

如果说训练算力是“开疆拓土”，那么推理算力就是“安邦定国”。当大模型应用走向规模化落地，高昂的推理成本成为制约业务发展的关键瓶颈。因此，一场以“降本增效”为核心的算力资源整合运动正在兴起。

前期，许多企业响应号召，在享有电价、土地等政策优惠的偏远地区建立了大规模的智算中心，主要部署了H800/H100及4090等高端训练显卡。如今，部分项目的补贴周期已经结束，而将这些高价值设备单纯用于训练的窗口期已过，将其转化为能持续产生价值的推理服务成为当务之急。

地理位置迁移：将这些存量的H系列和4090算力设备，从偏远的训练基地“移防”至靠近用户的一、二、三线城市或周边区域。其主要目的是降低网络延迟，提升用户访问AI应用（如聊天机器人、图像生成、生视频）的体验。

极致的成本控制：此类需求对机房的基础设施要求相对简化，但对机柜和电力成本（柜电资源2.5~3.5毛） 的敏感度极高。厂商寻求的是能提供稳定、廉价电力和机柜租赁服务的合作伙伴，以最大化降低推理服务的单位成本。

这为在核心城市群拥有数据中心资源，且具备成本优势的AIDC服务商带来了新的商机。能够提供“拎包入住”式低成本柜电资源的服务商，将成为承接这波“推理算力回迁潮”的主力军。这里的矛盾点是人口密集区的低成本柜电资源，偏远地区无法满足需求，推理延迟太大，成为主要的技术障碍，且目前没有好的低成本技术手段解决延迟问题；

满足特定项目需求，灵活的设备移机服务

除了技术和成本驱动，来自政策、合规和项目验收的需求也催生了独特的算力部署模式。这种需求不完全以性能或成本为首要目标，而是更侧重于满足特定项目的要求。

此需求主要来自于央国企背景的客户以及承担国家或地方“智算项目” 的企业。这些项目在立项和执行过程中，通常对计算设备的物理位置、品牌（如要求部分国产化）、资产归属有明确规定。

指定机房部署：要求算力供应商将特定型号的服务器（通常为H800/H100系列或高端国产训练服务器）整体迁移并部署到客户指定的机房内。

应付检查与验收：这种部署的主要目的之一是为了满足项目验收、上级检查或审计要求，证明项目资金已落实为具体的算力资产，并部署在合规地点。

灵活的租期：合作模式通常是为期6到24个月的短期或中期租赁。租约的灵活性至关重要，因为客户可能在检查通过后或项目阶段性完成后，有新的资产处置计划。

承接此类需求的服务商，不仅需要拥有相应的硬件资源，还必须具备强大的项目管理和物流实施能力，能够安全、高效地完成设备的迁移、上架、调试和后期运维，并能配合客户签署满足其特定条款的灵活合同。

总的来说，目前算力需求依然非常旺盛，且下半年呈现暴发之势。当前互联网大厂的算力需求正从“野蛮生长”迈向“精耕细作”的新阶段，呈现出三大鲜明特征：

性能与成本的二元化：一方面，为追赶模型能力的前沿，不惜重金投入Blackwell等顶级算力；另一方面，为应对规模化应用的成本压力，想方设法盘活存量资产，寻求极致的低成本推理方案。

资源部署的动态化：算力资源不再是静态部署，而是根据业务需求（低延迟）、成本结构（电价）和项目要求（合规）在全国范围内进行动态迁移和重新布局。

服务模式的复杂化：对算力供应商的要求已远不止提供硬件，而是需要集供应链整合、成本控制、技术运维、物流实施和灵活商务于一体的综合解决方案能力。

作为AI芯片和算力中心的从业者，深刻理解这三大需求方向，并提前布局相应的产品和服务组合——无论是稳定供应前沿芯片、打造低成本推理节点，还是提供灵活高效的移机部署服务——都将是在这场算力变革浪潮中把握先机、赢得客户的关键。

欢迎关注“算力百科”，为您带来算力市场最新动态信息。未来的算力市场，将是属于那些能够深刻洞察客户需求，并提供多元化、精细化服务的玩家。

全国首个算力和大模型工程专属服务IP

算力百科，承接独立咨询项目，以实战经验帮助甲方避坑，收费标准公开/透明：（50000+500*建设P数）/年/项，项目签约服务期限12个月，任何问题可咨询。

经验擅长：
1.设备选型：帮助甲方选择合适的AI卡和设备，组网、存储技术方案评审，避免“设备开机即淘汰”的尴尬局面；
2.转型咨询：IPO或者实体公司算力转型咨询，帮助转型的公司避免 “算力陷阱”和“合同陷阱”等；帮助搭建算力"研发-建设-运维-运营"的自有团队；
3.绿算咨询：协助甲方咨询和规划绿电和算力之间平衡，造价评估和商业模式设计，避免入坑；
价评议价格合理性，避免甲方被“割韭菜”；
算力宝典，第一章、算力中心从入门到精通【概述篇】
算力宝典，第二章算力中心从入门到精通【模式篇】
算力宝典，第三章、算力中心从入门到精通【方案篇】
算力宝典第四章、算力中心从入门到精通【公式篇】
算力宝典第五章《算力中心从入门到精通【运营篇】
欢迎加入社群↓

阅读原文

跳转微信打开

追求极致FP4性能，对Blackwell架构及FP4前沿算力的渴求

满足特定项目需求，灵活的设备移机服务

算力宝典，第二章算力中心从入门到精通【模式篇】

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签

追求极致FP4性能，对Blackwell架构及FP4前沿算力的渴求

满足特定项目需求，灵活的设备移机服务

算力宝典，第二章 算力中心从入门到精通【模式篇】

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签

算力宝典，第二章算力中心从入门到精通【模式篇】