算力百科 07月08日 14:33
近期大厂算力需求方向:FP4算力、低成本柜电、移机指定AIDC等
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

随着人工智能技术发展,算力需求呈现精细化、多元化新趋势。大厂在算力采购、部署和运维上展现三大新方向:追求前沿FP4算力,对低成本推理服务需求迫切,以及由合规与项目驱动的灵活设备移机。NVIDIA B200、B20/B40、RTX 5090等芯片成为热点。同时,将高价值设备从偏远地区移至人口密集区,降低推理成本。央国企和智算项目对设备移机服务需求增加,要求算力供应商提供综合解决方案能力。

🔹FP4算力需求:针对英伟达最新Blackwell架构算力,有序按需提供算力;NVIDIA B200、B20/B40、RTX 5090等芯片成为热点,满足大模型训练和推理需求。

🔹低成本柜电需求:只要求靠近人口密集城市,且提供低成本柜电资源;将高价值设备从偏远地区移至人口密集区,降低推理成本,提升用户体验。

🔹设备移机需求:大厂接到大量的移机需求,针对央国企和一些智算项目应付检查的需求;要求算力供应商提供灵活的设备移机服务,满足特定项目的要求。

🔹算力资源整合:将存量的H系列和4090算力设备,从偏远的训练基地“移防”至靠近用户的一、二、三线城市或周边区域,降低网络延迟,提升用户访问AI应用的体验。

🔹服务模式复杂化:对算力供应商的要求已远不止提供硬件,而是需要集供应链整合、成本控制、技术运维、物流实施和灵活商务于一体的综合解决方案能力。

原创 算力百科 J 2025-07-07 06:01 贵州

1.FP4算力需求:针对英伟达最新Blackwell架构算力,有序按需提供算力;

2.低成本柜电需求:只要求靠近人口密集城市,且提供低成本柜电资源;

3.设备移机需求:大厂接到大量的移机需求,针对央国企和一些智算项目应付检查的需求

    随着人工智能技术的飞速发展,特别是大语言模型的深入应用,算力已成为互联网及科技企业的核心战略资源。近期,市场对算力的需求不再是单一的规模扩张,而是呈现出更加精细化、多元化和场景化的新趋势。各大互联网厂商在算力采购、部署和运维上,正展现出三大显著的新方向:对前沿FP4算力的极致追求、对低成本推理服务的迫切需求,以及由合规与项目驱动的灵活设备移机。

    Pangu 员工自曝:套壳、续训、洗水印,hw基于qwen继续训练被证实之后,截止目前,用国产算力训练大模型的公司“全部暴雷”,至此,国内所有到大模型0到1阶段的训练全部依赖N卡,1到100的增量训练可以依靠国产卡继续训练,已经是非常大的进步啦!

    所以N卡是目前国内训练算力唯一来源,国产卡目前正在努力追赶,尚没有0到1完成大模型训练的成功案例!

 追求极致FP4性能,对Blackwell架构及FP4前沿算力的渴求

    应对下半年R2等新模型发布,在模型训练的“军备竞赛”中,更高的算力效率和更低的单次训练成本是永恒的追求。随着英伟达最新Blackwell架构的发布,互联网大厂的目光迅速聚焦于其带来的革命性性能提升,尤其是对FP4(4位浮点数)数据格式的支持。

    大厂在此阶段的需求呈现出“有序规划、按需供给”的特点。它们不再是盲目囤积,而是根据自身模型的研发路线图和业务上线节奏,与核心供应商进行深度洽谈,寻求长期的、可预测的供应保障。这要求算力供应商不仅要有稳定的货源渠道,更需要具备强大的供应链整合与交付能力。这里特别注意,自用算力只跟稳定的大供应直签,小供应商没机会!

     人口密集区的低成本柜电与推理算力资源的整合

    如果说训练算力是“开疆拓土”,那么推理算力就是“安邦定国”。当大模型应用走向规模化落地,高昂的推理成本成为制约业务发展的关键瓶颈。因此,一场以“降本增效”为核心的算力资源整合运动正在兴起。

    前期,许多企业响应号召,在享有电价、土地等政策优惠的偏远地区建立了大规模的智算中心,主要部署了H800/H100及4090等高端训练显卡。如今,部分项目的补贴周期已经结束,而将这些高价值设备单纯用于训练的窗口期已过,将其转化为能持续产生价值的推理服务成为当务之急。

    这为在核心城市群拥有数据中心资源,且具备成本优势的AIDC服务商带来了新的商机。能够提供“拎包入住”式低成本柜电资源的服务商,将成为承接这波“推理算力回迁潮”的主力军。这里的矛盾点是人口密集区的低成本柜电资源,偏远地区无法满足需求,推理延迟太大,成为主要的技术障碍,且目前没有好的低成本技术手段解决延迟问题;

满足特定项目需求,灵活的设备移机服务

    除了技术和成本驱动,来自政策、合规和项目验收的需求也催生了独特的算力部署模式。这种需求不完全以性能或成本为首要目标,而是更侧重于满足特定项目的要求。

    此需求主要来自于央国企背景的客户以及承担国家或地方“智算项目” 的企业。这些项目在立项和执行过程中,通常对计算设备的物理位置、品牌(如要求部分国产化)、资产归属有明确规定。

    承接此类需求的服务商,不仅需要拥有相应的硬件资源,还必须具备强大的项目管理和物流实施能力,能够安全、高效地完成设备的迁移、上架、调试和后期运维,并能配合客户签署满足其特定条款的灵活合同。

    总的来说,目前算力需求依然非常旺盛,且下半年呈现暴发之势。当前互联网大厂的算力需求正从“野蛮生长”迈向“精耕细作”的新阶段,呈现出三大鲜明特征:

    性能与成本的二元化:一方面,为追赶模型能力的前沿,不惜重金投入Blackwell等顶级算力;另一方面,为应对规模化应用的成本压力,想方设法盘活存量资产,寻求极致的低成本推理方案。

    资源部署的动态化:算力资源不再是静态部署,而是根据业务需求(低延迟)、成本结构(电价)和项目要求(合规)在全国范围内进行动态迁移和重新布局。

    服务模式的复杂化:对算力供应商的要求已远不止提供硬件,而是需要集供应链整合、成本控制、技术运维、物流实施和灵活商务于一体的综合解决方案能力。

    作为AI芯片和算力中心的从业者,深刻理解这三大需求方向,并提前布局相应的产品和服务组合——无论是稳定供应前沿芯片、打造低成本推理节点,还是提供灵活高效的移机部署服务——都将是在这场算力变革浪潮中把握先机、赢得客户的关键。

    欢迎关注“算力百科”,为您带来算力市场最新动态信息。未来的算力市场,将是属于那些能够深刻洞察客户需求,并提供多元化、精细化服务的玩家。

全国首个算力和大模型工程专属服务IP

        算力百科,承接独立咨询项目,以实战经验帮助甲方避坑,收费标准公开/透明:(50000+500*建设P数)/年/项,项目签约服务期限12个月,任何问题可咨询。

经验擅长:

1.设备选型:帮助甲方选择合适的AI卡和设备,组网、存储技术方案评审,避免“设备开机即淘汰”的尴尬局面;

2.转型咨询:IPO或者实体公司算力转型咨询,帮助转型的公司避免 “算力陷阱”和“合同陷阱”等;帮助搭建算力"研发-建设-运维-运营"的自有团队;

3.绿算咨询:协助甲方咨询和规划绿电和算力之间平衡,造价评估和商业模式设计,避免入坑;

价评议价格合理性,避免甲方被“割韭菜”;

算力宝典,第一章、算力中心从入门到精通【概述篇】

算力宝典,第二章 算力中心从入门到精通【模式篇】

算力宝典,第三章、算力中心从入门到精通【方案篇】

算力宝典 第四章、算力中心从入门到精通【公式篇】

算力宝典 第五章《算力中心从入门到精通【运营篇】

欢迎加入社群↓

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

算力 人工智能 大模型 FP4 设备移机
相关文章