原创 算力百科 J 2025-07-07 06:01 贵州
1.FP4算力需求:针对英伟达最新Blackwell架构算力,有序按需提供算力;
2.低成本柜电需求:只要求靠近人口密集城市,且提供低成本柜电资源;
3.设备移机需求:大厂接到大量的移机需求,针对央国企和一些智算项目应付检查的需求
随着人工智能技术的飞速发展,特别是大语言模型的深入应用,算力已成为互联网及科技企业的核心战略资源。近期,市场对算力的需求不再是单一的规模扩张,而是呈现出更加精细化、多元化和场景化的新趋势。各大互联网厂商在算力采购、部署和运维上,正展现出三大显著的新方向:对前沿FP4算力的极致追求、对低成本推理服务的迫切需求,以及由合规与项目驱动的灵活设备移机。
Pangu 员工自曝:套壳、续训、洗水印,hw基于qwen继续训练被证实之后,截止目前,用国产算力训练大模型的公司“全部暴雷”,至此,国内所有到大模型0到1阶段的训练全部依赖N卡,1到100的增量训练可以依靠国产卡继续训练,已经是非常大的进步啦!
所以N卡是目前国内训练算力唯一来源,国产卡目前正在努力追赶,尚没有0到1完成大模型训练的成功案例!
追求极致FP4性能,对Blackwell架构及FP4前沿算力的渴求
应对下半年R2等新模型发布,在模型训练的“军备竞赛”中,更高的算力效率和更低的单次训练成本是永恒的追求。随着英伟达最新Blackwell架构的发布,互联网大厂的目光迅速聚焦于其带来的革命性性能提升,尤其是对FP4(4位浮点数)数据格式的支持。
核心驱动力:大模型参数量和训练数据量呈指数级增长,传统的FP16/FP8已难以在成本和效率之间达到最优平衡。FP4格式能在大幅降低显存占用和通信带宽的同时,通过先进的硬件和软件协同设计,保持模型训练和推理的精度,实现训练速度和推理吞吐量的翻倍增长。
NVIDIA B200:作为旗舰训练芯片,是头部大厂进行下一代万亿级模型训练的首选,需求量巨大,但供应紧张。
NVIDIA B20/B40:面向更广泛的企业和推理市场,提供了更灵活的配置和更高的能效比,适合模型精调、行业模型训练及高通量推理场景。
NVIDIA RTX 5090 :虽然定位消费级,但凭借其强大的性能和相对较低的获取门槛,将被大量用于模型开发、算法验证和中小型推理集群,成为“平民法拉利”。
大厂在此阶段的需求呈现出“有序规划、按需供给”的特点。它们不再是盲目囤积,而是根据自身模型的研发路线图和业务上线节奏,与核心供应商进行深度洽谈,寻求长期的、可预测的供应保障。这要求算力供应商不仅要有稳定的货源渠道,更需要具备强大的供应链整合与交付能力。这里特别注意,自用算力只跟稳定的大供应直签,小供应商没机会!
人口密集区的低成本柜电与推理算力资源的整合
如果说训练算力是“开疆拓土”,那么推理算力就是“安邦定国”。当大模型应用走向规模化落地,高昂的推理成本成为制约业务发展的关键瓶颈。因此,一场以“降本增效”为核心的算力资源整合运动正在兴起。
前期,许多企业响应号召,在享有电价、土地等政策优惠的偏远地区建立了大规模的智算中心,主要部署了H800/H100及4090等高端训练显卡。如今,部分项目的补贴周期已经结束,而将这些高价值设备单纯用于训练的窗口期已过,将其转化为能持续产生价值的推理服务成为当务之急。
地理位置迁移:将这些存量的H系列和4090算力设备,从偏远的训练基地“移防”至靠近用户的一、二、三线城市或周边区域。其主要目的是降低网络延迟,提升用户访问AI应用(如聊天机器人、图像生成、生视频)的体验。
极致的成本控制:此类需求对机房的基础设施要求相对简化,但对机柜和电力成本(柜电资源2.5~3.5毛) 的敏感度极高。厂商寻求的是能提供稳定、廉价电力和机柜租赁服务的合作伙伴,以最大化降低推理服务的单位成本。
这为在核心城市群拥有数据中心资源,且具备成本优势的AIDC服务商带来了新的商机。能够提供“拎包入住”式低成本柜电资源的服务商,将成为承接这波“推理算力回迁潮”的主力军。这里的矛盾点是人口密集区的低成本柜电资源,偏远地区无法满足需求,推理延迟太大,成为主要的技术障碍,且目前没有好的低成本技术手段解决延迟问题;
满足特定项目需求,灵活的设备移机服务
除了技术和成本驱动,来自政策、合规和项目验收的需求也催生了独特的算力部署模式。这种需求不完全以性能或成本为首要目标,而是更侧重于满足特定项目的要求。
此需求主要来自于央国企背景的客户以及承担国家或地方“智算项目” 的企业。这些项目在立项和执行过程中,通常对计算设备的物理位置、品牌(如要求部分国产化)、资产归属有明确规定。
指定机房部署:要求算力供应商将特定型号的服务器(通常为H800/H100系列或高端国产训练服务器)整体迁移并部署到客户指定的机房内。
应付检查与验收:这种部署的主要目的之一是为了满足项目验收、上级检查或审计要求,证明项目资金已落实为具体的算力资产,并部署在合规地点。
灵活的租期:合作模式通常是为期6到24个月的短期或中期租赁。租约的灵活性至关重要,因为客户可能在检查通过后或项目阶段性完成后,有新的资产处置计划。
承接此类需求的服务商,不仅需要拥有相应的硬件资源,还必须具备强大的项目管理和物流实施能力,能够安全、高效地完成设备的迁移、上架、调试和后期运维,并能配合客户签署满足其特定条款的灵活合同。
总的来说,目前算力需求依然非常旺盛,且下半年呈现暴发之势。当前互联网大厂的算力需求正从“野蛮生长”迈向“精耕细作”的新阶段,呈现出三大鲜明特征:
性能与成本的二元化:一方面,为追赶模型能力的前沿,不惜重金投入Blackwell等顶级算力;另一方面,为应对规模化应用的成本压力,想方设法盘活存量资产,寻求极致的低成本推理方案。
资源部署的动态化:算力资源不再是静态部署,而是根据业务需求(低延迟)、成本结构(电价)和项目要求(合规)在全国范围内进行动态迁移和重新布局。
服务模式的复杂化:对算力供应商的要求已远不止提供硬件,而是需要集供应链整合、成本控制、技术运维、物流实施和灵活商务于一体的综合解决方案能力。
作为AI芯片和算力中心的从业者,深刻理解这三大需求方向,并提前布局相应的产品和服务组合——无论是稳定供应前沿芯片、打造低成本推理节点,还是提供灵活高效的移机部署服务——都将是在这场算力变革浪潮中把握先机、赢得客户的关键。
欢迎关注“算力百科”,为您带来算力市场最新动态信息。未来的算力市场,将是属于那些能够深刻洞察客户需求,并提供多元化、精细化服务的玩家。
全国首个算力和大模型工程专属服务IP算力百科,承接独立咨询项目,以实战经验帮助甲方避坑,收费标准公开/透明:(50000+500*建设P数)/年/项,项目签约服务期限12个月,任何问题可咨询。
经验擅长:1.设备选型:帮助甲方选择合适的AI卡和设备,组网、存储技术方案评审,避免“设备开机即淘汰”的尴尬局面;2.转型咨询:IPO或者实体公司算力转型咨询,帮助转型的公司避免 “算力陷阱”和“合同陷阱”等;帮助搭建算力"研发-建设-运维-运营"的自有团队;3.绿算咨询:协助甲方咨询和规划绿电和算力之间平衡,造价评估和商业模式设计,避免入坑;价评议价格合理性,避免甲方被“割韭菜”;算力宝典,第二章 算力中心从入门到精通【模式篇】
欢迎加入社群↓