2025年以来,生成式AI的风潮已经从卷技术,逐渐走向卷应用、但大半年过去了,各行业虽然有不少应用场景出现,但距离企业级AI应用的“iPhone时刻”似乎又离的很远。
究其原因,一方面是企业内部训练、微调大模型的数据量远远不够;另一方面,在算力利用率、异构多元算力融合方面,行业仍有一段路要走。
智算行业兴起
自从ChatGPT问世之后,生成式AI成为了全球科技圈热议的焦点,而作为生成式AI底层支撑的智能算力,也迎来了快速增长的时代。据工信部数据显示,截至 2025 年一季度,中国智算规模已达到 748EFlops,占整体算力规模的 35%,智算已经成为算力增长的核心驱动力。
无独有偶,IDC也十分看好中国智算产业发展,IDC数据显示,2025年,中国智能算力规模将达到1037.3EFLOPS,预计2028年将达到2781.9EFLOPS;中国通用算力规模将达到85.8EFLOPS,预计2028年将达到140.1EFLOPS,对此,IDC中国副总裁周震刚曾告诉笔者,从增加趋势上分析,2023-2028年,中国智能算力五年年复合增长率预计将达到46.2%,通用算力预计将达到18.8%,预计到2028年,中国智能算力规模将达到2781.9EFLOPS,是2024年的近四倍。
从数据上不难看出,目前,用户对于算力的需求,绝大部分的增量将产生在智能算力方面。
从服务器出货量角度,也可以看出目前智算已经成为算力产业发展的主流趋势。据IDC数据显示,2024年全球人工智能服务器市场规模为1251亿美元,2025年将增至1587亿美元,2028年有望达到2227亿美元,其中生成式人工智能服务器占比将从2025年的29.6%提升至2028年的37.7%。
而庞大的需求主要来自生成式AI技术和应用的爆发,仅2024上半年,中国GenAI IaaS市场同比增长203.6%,市场规模达52亿元人民币,占比整体智算服务市场35.6%。
当生成式AI的技术逐渐成熟,业内也在逐渐从“卷”模型技术,向着“卷”AI应用的方向出发。在此趋势下,大模型技术的演进也随之从预训练侧,向着推理侧、后训练侧发展。对此,联想中国基础设施业务群战略管理总监黄山表示,行业的算力需求从预训练主导转向了后训练和推理主导。
此外,在应用层面,AI已经开始对企业流程进行智能化改造,尤其是在DeepSeek问世之后,诸如医疗、生物科学、交通等领域的垂类应用不断涌现,在应用侧对于后训练、推理的要求会更高,“对于算力产业而言,从应用层到算力层都发生了很大的变化,”黄山进一步指出,“在变化的过程中,应用层、模型层、算力层软件之间的相互影响很大。”
这种相互作用的影响也推动了智算产业的变革,一方面,智算在自己的“赛道”内不断向前发展;另一方面,智算的发展并非孤立存在,智算与超算、通算之间实现“超智融合”也成为当前算力产业发展的关键。
超智融合是关键
从宏观维度看,超智融合不仅能够充分发挥各类算力的优势,实现资源的高效利用,更能为解决复杂的科学问题、推动产业升级提供强大支撑。
超算与智算、传统数据中心之间最大的差别是应用场景不同。超算主要应用于大规模科学计算、工程仿真、气象预报、生物信息等领域,这些应用需要处理海量数据和高复杂度计算,对计算性能要求极高。
智算则主要应用于人工智能、机器学习、图像处理、语音识别等领域,这些应用需要快速迭代和优化模型,对计算效率要求较高。而相较于超算、智算而言,传统数据中心的应用则更加广泛,包括云计算、大数据分析、企业级应用等。
而超算、智算、通算的融合,也成为了整个算力产业接下来很长一段时间发展的重点方向。具体来看,在算力方面,超智融合可以提升算力效率,降低能耗成本。通过实现超智融合,可根据具体任务需求灵活调度算力资源,避免资源浪费。例如,在气象预测中,超算提供高性能计算支持复杂模型的模拟,智算进行数据分析和结果优化,通算处理日常业务数据,三者协同提升效率。
在应用方面,超智融合可以推动科学研究与产业创新,为解决复杂的科学问题提供了强大工具。例如,国家超级计算无锡中心的超智融合算力平台系统,为新药研发、企业级智能增强系统等提供全栈智能应用计算解决方案。在产业领域,超智融合助力制造业智能化升级。三一重工通过整合通算、智算和超算资源,实现了生产流程的数字化和智能化,产能提升 123%,人员效率提升 98%,单位制造成本降低 29%。
对此,黄山也向笔者介绍了一些联想在超智融合方面的经验和案例,他表示,在联想与北京大学的合作中,双方共同建设了高性能计算平台,平台以联想开发的模型为底座,采用联想深腾X8810系统,并配置联想数据中心采用的英特尔至强铂金处理器,为各学科领域提供大规模数据处理和大规模科学计算的支持。
“以生命科学研究场景为例,原先需要15分钟才能完成的核磁共振影像结果,通过该平台的加持,现在仅需20秒左右就能完成。”黄山介绍道。
此外,在与吉利汽车的合作中,联想和英特尔共同为吉利打造了一套HPC集群化解决方案。该方案通过联想万全异构智算平台HPC版和英特尔五代至强可扩展处理器,对“星睿智算HPC集群”进行升级,提升了研发效率,缩短了产品迭代周期。“在多达5000个CPU的仿真集群中,通过异构算力平台,融合HPC与智算的能力,”黄山进一步指出,“目前,该方案已经落地了超过19种仿真应用。”
异构算力融合仍面临挑战
超算与智算的融合首先体现在硬件架构的深度重构。传统超算以 CPU 为核心,侧重双精度浮点运算(FP64),而智算依赖 GPU/TPU 等加速芯片,聚焦半精度(FP16)和整数运算(INT8)。两者的硬件架构和计算范式存在本质差异。这种架构差异在AI for Science场景中形成瓶颈,比如,蛋白质结构预测需要同时处理高精度分子模拟与数据驱动的模型优化。
除此之外,超算的“时间复杂度”与智算的“空间复杂度”难以兼容。融合需从芯片设计、存储网络到算法层面实现软硬协同创新,例如通过动态异构资源池化技术解决算力调度问题。所以超智融合目前来看仍是一个比较棘手的问题。
对此,黄山指出,超算与智算的融合,目前还存在一些难点,主要是因为两种计算模式下,算力调度机制不同,融合调度机制将成为接下来实现超智融合过程中,最需要首先解决的问题。
除此之外,黄山告诉笔者,算法也是实现超算与智算融合发展的一大掣肘,“因为超算与智算的算法也完全不同,在计算过程中,如何将双方的计算结果结合在一起,进而进行融合计算,也是实现超智融合的难点之一。”黄山强调道。
而面对超算、智算、通算融合难题,平台化的解决方案似乎成为了当前状态下的最优解。以联想为例,其通过 “一横五纵” 战略框架构建了覆盖通用、科学、AI 算力的异构智算平台——万全异构智算平台。黄山表示,万全异构智算平台是联想AI方案的整体抓手,通过智算与HPC计算硬件方面多年的积累,再加上对于软硬协同方面的行业Know-How,提高了算力的利用率,并优化了软硬件之间的适配度,向上支持模型应用,向下融合异构算力。
在软件层面,联想通过万全异构智算平台3.0实现HPC与AI框架的无缝衔接。其AI编译优化器采用算子融合与路径优化技术,降低训练与推理成本各15%以上;专家并行通信算法针对MoE架构通信瓶颈,通过计算通信协同优化将推理时延降低三倍,网络带宽利用率达90%。
在硬件层面,联想通过万全异构智算平台持续拓展与国内外知名合作伙伴的长期合作。资料显示,万全异构智算平台3.0已实现了对大多数国内芯片实现了兼容,兼容后较传统CPU集群提速15倍。
在模型层面,万全异构智算平台已经接入了包括DeepSeek在内的,目前市面上主流的开源大模型,并且可以针对MoE、LLM等不同架构的模型,提供想对应的适配与优化。正如黄山前文所述——万全异构智算平台已经成为联想集团在企业级AI落地方面的核心抓手。
而在异构算力平台及整合大模型能力平台方面布局不仅是联想独有的布局,从市面上常见的软硬件服务商的布局可以看出,平台化的软件产品的与硬件的结合,是当下提升硬件易用性的最优解,围绕此,神州数码推出了神州文学平台、浪潮信息推出了EPAI平台、青云科技推出了AI智算平台.......
综合来看,通过平台化的产品和生态的构建,推进超算、智算,以及通算融合已经是大势所趋,而超算、智算、通算的融合不仅是技术路径的选择,更是AI时代的必经之路。通过硬件异构化、软件协同化、网络泛在化的技术突破,以及科研、工业、医疗等领域的深度应用,超智融合正在重构计算范式,推动生产力跃升。
未来,随着内生智能计算系统的成熟,超算与智算的界限将彻底模糊,形成 “超级智能计算” 新形态,开启人类认知与创新的新纪元。
(本文首发于钛媒体APP,作者|张申宇,编辑丨盖虹达)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App