原创 算力百科 2025-02-13 06:01 上海
用于训练原创教师模型,简称A类(加大投入),这类算力中心定位0到1的原创教师模型训练。需要使用万卡,十万卡,乃至百万卡的训练算力,这也是星际之门的主要用途,或者训练场项目的主要用途,这类不计成本投入,要的是先进性。
结论现行
未来AI大模型竞争的核心是谁能训练出国际领先的教师模型,目前的竞争者是GPT和Deepseek。
蒸馏能有好的模型的前提是有一个好的教师模型,原创的教师模型训练是0到1,需要非常大的算力,也就是目前在建设的“训练场”“星际之门”“InvestAI计划”的意义,大算力是有意义的,只是不需要那么多个,全球几个超大算力中心足矣,未来全球的原创教师模型不会超过5个,需要持续迭代,保持6~18个月领先不被超越。
智算中心ABC三类定位
1)用于训练原创教师模型,简称A类(建设加快),这类算力中心定位0到1的原创教师模型训练。需要使用万卡,十万卡,乃至百万卡的训练算力,这也是星际之门的主要用途,或者训练场项目的主要用途,这类不计成本投入,要的是先进性。
这类算力中心需要持续投资建设N卡H200 B200 甚至NVL72类似的设备,长期规划投资1000个小目标以上,并且持续深耕,投入型。
2)用于蒸馏1到N的学生模型,简称B类(已经饱和),这类算力中心,主要是蒸馏新的应用模型或者行业模型,按需使用,这类算力中心主要是A/H为主,主要考虑性价比。
这类算力中心基本上就利旧目前的A和H系列设备即可,设备roce即可,IB更好但是性价比不好,几十台到几百台为主,或者采购一部分高端的国产AI卡做个尝试,做尝试就有失败,做提前做好预期管理。
3)用于推理的算力中心,简称C类(25年爆发增长),主要用于部署教师和学生模型,用于推理业务,主要考虑性价比,特别是互联网公司和创业公司,对性价比敏感。
这类的算力中心基本上就是利旧原有设备或者经营不善的B类。比如3090、4090或者910A/ B和其他国产卡,如果要新增一定是选择48GB 4090或者RTX50系列,定位推理算力,可以持续打价格战,价格持续走低。
A类算力中心布局
当中国“深度求索”(DeepSeek)大模型以雷霆之势突破技术壁垒,以高性价比撕开美国垄断的铁幕,世界为之震动!此刻,中美欧三大力量正以史无前例的雄心和投入,在智算中心的疆场上展开殊死角逐——这不仅是算力的比拼,更是国家意志的较量,人类文明新纪元的曙光正在这场激战中喷薄欲出!
一、美国“星际之门”:5000亿美元铸就的AI帝国。美国以震撼全球的5000亿美元巨资,打造名为“星际之门”的超级工程!这柄由特朗普亲自挥动的科技重锤,集结OpenAI、软银、甲骨文三大巨头之力,誓要在全美铺就覆盖物理与虚拟空间的AI基础设施网络。未来四年内,数以万计的数据中心将如星辰般密布北美大陆,构建起支撑下一代大模型的算力矩阵!这不仅是资本的狂欢,更是美国对AI霸权赤裸裸的宣示——他们要建立的是能主导全球规则的数字“新罗马”!
二、欧洲“InvestAI计划”:2000亿欧元点燃的复兴之火。面对中美双雄的夹击,欧盟以破釜沉舟之势推出“InvestAI计划”,豪掷2000亿欧元重塑科技版图!法国总统马克龙振臂高呼:“欧洲决不做数字时代的旁观者!” 这不仅是资金的注入,更是一场关乎欧洲尊严的背水之战——从巴黎到柏林,从AI伦理框架到跨境算力联盟,欧洲正以“技术中立”为旗帜,在严防技术孤岛的同时,打造兼顾创新与人文价值的AI生态。尤其当法国单枪匹马祭出1090亿欧元投资时,整个欧罗巴都在为科技主权而战!
三、中国“训练场”:东方巨龙的算力觉醒。当DeepSeek大模型以燎原之势横扫国际市场,中国正以“训练场”为代号,掀起智算中心建设的狂飙突进!超大规模智算集群正以中国速度拔地而起,每一块GPU的闪烁都在诉说一个真理:在AI这场“智能军备竞赛”中,中国不仅要参赛,更要领跑!
已经参分到蛋糕的厂商继续深耕“训练场”业务,毕竟利润丰厚,没分到蛋糕的不要再折腾A类,建议重点放在C类,识时务者为俊杰,投入ROI会更高。
自从写了《DeepSeek让多地智算中心停建 》受到了很多认识的领导的批评,毕竟大家都以算力中心建设为生,紧急补了一篇《DeepSeek让智算中心分A/B/C型重建》 ,希望大家理性思考,能给大家带来一些启发和思考,干一行,爱一行,行行行,请不要唱衰。
未来,中美欧三足鼎立?还是一超多强?还是一枝独秀?!欢迎一起讨论?欢迎加入DS前瞻圈,一起领略Deepseek引领AI文艺复兴!!