《AI X Science十大前沿观察》发布：35个研究前沿，开启科学发现的黄金时代

原创集智与上智院 2025-04-27 17:55 上海

人工智能与科学研究的深度融合

导语

从未来回望，2025年将被定义为“人工智能与科学发现深度融合的元年”。而这源于2024年两项诺贝尔奖均授予了AI深度参与其中的研究。物理学奖授予了科学家John J. Hopfield和Geoffrey E. Hinton，以表彰他们在使用人工神经网络进行机器学习方面的基础性发现和开创性贡献。诺贝尔化学奖则颁发给了科学家David Baker、Demis Hassabis和John M. Jumper，以表彰他们在计算机蛋白设计及蛋白质结构预测领域的杰出成就。

为了梳理这一快速发展的全新领域，上海科学智能研究院、集智科学研究中心和阿里云共同发布了“AI X Science十大前沿观察”，梳理出35个研究前沿，来推动科学发展的黄金时代到来。报告全文可以扫描下方二维码获取，并可快速链接论文原文。

扫描二维码下载完整报告

出品：漆远、吴力波、张江
运营：孟晋宇、王婷
撰稿：张江、杨燕青、王婷、王朝会、十三维、周莉、梁金、袁冰、江千月、刘志毅
鸣谢（按姓氏拼音顺序，排名不分先后）：曹风雷、陈小杨、程远、杜沅岂、段郁、方榯楷、付彦伟、高悦、黄柯鑫、李昊、刘圣超、谭伟敏、吴泰霖、吴艳玲、向红军、张骥、张艳、朱思语

序章

AI X Science，即人工智能与科学研究的深度融合，具体包括两方面：将AI技术应用于领域学科的新兴研究方法（AI for Science）；将领域学科知识用于AI算法和架构的理解和改进工作（Science for AI）。

2024年诺贝尔物理学奖授予的是将物理学用于AI系统设计的研究，即Science for AI，而诺贝尔化学奖授予的是人工智能算法用于解决化学领域重要问题的研究，即AI for Science。

AI for Science

随着数据的快速积累和文献的爆炸式增长，人类科学家自身的信息处理能力已经成为了制约某些学科快速发展的瓶颈。而越来越多的科学研究领域在面对复杂问题的挑战时难以利用传统的数学和物理方法，例如蛋白质结构预测、新材料的设计、复杂流体系统的模拟等等。

另一方面，随着大数据时代的降临和算力的提升，人工智能技术正飞速发展。以ChatGPT为代表的大语言模型（Large Language Model，简称LLM）是AI发展史上的重大突破，而近期推理模型异军突起，例如GPT-o1/o3和Deepseek R1已经具备了强大的学习能力和推理能力，甚至可以成为科研人员重要的助手，辅助解决一定级别的科研问题。因此，如何将AI先进技术用于具体的科学领域，加速科学研究的速度成为了AI for Science研究领域的重要挑战。

已有的AI for Science案例包括：

AlphaFold

用AlphaFold3预测的精准蛋白质结构 | 来源：Abramson， J.， Adler， J.， Dunger， J. et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature 630， 493–500 (2024).

斩获2024年诺贝尔化学奖的Baker、Hassabis和Jumper的研究工作就是将深度学习技术应用于蛋白质结构预测与设计这一经典领域。蛋白质是生命的“基础建筑块”，它不仅可以催化生化反应、调节生理机制，还可以调控基因表达，运输生命必需物质以及用于抵抗病毒、细菌入侵等重要功能。Hassabis与Jumper开发的AlphaFold系列工作，可以精准预测蛋白质结构，准确度已经接近专家水平，速度则远超人类。最新版本的AlphaFold则可以预测几乎所有分子类型的蛋白质复合物结构。

气象预测大模型

GraphCast：用于更快速、更准确的全球天气预报的人工智能模型 | 来源：Remi Lam et al.， Learning skillful medium-range global weather forecasting.Science382，1416-1421(2023)

随着全球变暖，极端天气会越来越多的影响人类生活生存环境。因此，如何更加精准地对未来天气发展进行准确预测，特别是防患极端天气的到来越来越成为意义重大的科学问题。然而，传统的气象学研究受限于数据的缺乏、人类知识和经验的局限以及气象系统内在的不确定性因素等影响，无法给出较长期而精准的预测。因此，如何将大模型等最新的AI技术引入气象领域，已经成为了近年来AI for Science研究的焦点之一。近年来，若干气象预测大模型被陆续开发出来，包括Google的GraphCast、华为的盘古大模型、英伟达的FourCastNet、复旦大学-上海科学智能研究院的伏羲气象大模型等都取得了显著进展。

AI可控核聚变

通过深度强化学习控制聚变等离子体以避免撕裂不稳定性的模型框架 | 来源：Seo， J.， Kim， S.， Jalalvand， A. et al. Avoiding fusion plasma tearing instability with deep reinforcement learning. Nature 626， 746–751 (2024)

核聚变是一种清洁、安全、便利的新型能源。与化石燃料相比，聚变能的使用可以显著减少对环境的影响，有助于应对气候变化。核聚变反应需要在极高温度和压力下进行，因此等离子体的稳定性是实现可控核聚变的关键。AI技术可以用于实时监测和控制等离子体状态，预测不稳定性并及时调整实验参数，以保持等离子体的稳定。2024年初，普林斯顿大学和普林斯顿等离子体物理实验室的研究人员在可控核聚变领域取得突破，他们发现了一种方法，可以利用AI预测这种潜在的不稳定性，并且实时防止实验中断。相关研究成果发表在了2024年2月份的Nature刊物上。

Science for AI

即使已获重大突破，但AI技术仍然面临数据稀缺、算力稀缺、耗能过大、解释性较差等重大挑战。另一方面，人类科学家已经积累了各个学科领域的海量知识。如何将科学家的经验和知识，甚至一些不成型的启发式想法，转化为AI系统的能力，让AI系统与人类专家能够更好地互动、协作，构成了Science for AI研究领域的重大挑战。

目前，已有的Science for AI案例包括：

Hopfield网络与受限Boltzmann机

ISING模型、Hopfield网络以及受限Boltzmann机 | 来源：https://www.nobelprize.org/prizes/physics/2024/press-release/

本次诺贝尔物理学奖授予的两名学者，Hopfield和Hinton正是将统计物理中的经典模型的变种应用于神经网络架构设计，从而大大提升了机器学习问题的求解效率，为人类进入深度学习时代开辟了先河。Hopfield所提出的Hopfield网络模型是在统计物理的ISING模型的基础上改进而得到的，它可以通过训练学习记忆一些固定的模式，并在应用阶段激活、回忆起这些模式。在Hopfield网络模型的基础上，Hinton所提出的受限Boltzmann机模型则可以通过大量数据的训练，学习数据的压缩表征，并可以通过拼接多层的方式，获得数据在多个尺度上的深层次表征。这些表征可以进一步用来分类或预测。

视觉架构启发的CNN网络

用于图像识别的卷积神经网络架构 | 来源：Hoeser， T.; Kuenzer， C. Object Detection and Image Segmentation with Deep Learning on Earth Observation Data: A Review-Part I: Evolution and Recent Trends. Remote Sens. 2020， 12， 1667.

对真实生物神经网络结构的研究有助于人们提出更先进的人工智能系统架构。例如，卷积神经网络（CNN）的提出就受到了生物神经网络研究的启发，尤其是对视觉系统的理解。早在20世纪60年代，神经科学家David Hubel和Torsten Wiesel通过对猫的视觉皮层进行实验，发现了视觉神经元的不同反应特性。他们观察到，某些神经元对特定方向的边缘或图案表现出强烈的反应，称为简单细胞；而另一些神经元则对更复杂的视觉刺激（如形状和运动）有反应，称为复杂细胞。这种对视觉神经元功能的理解为CNN的设计提供了重要的理论基础。CNN模拟了生物视觉系统中的层次结构，通过多层网络逐步提取特征。最初的卷积层相当于简单细胞，负责检测图像中的基本特征，如边缘和角落；而后续的层则类似于复杂细胞，能够识别更高层次的特征，如形状和物体。此外，CNN中的卷积操作和池化操作也受到生物神经网络的启发。卷积操作通过局部感受野的方式，模拟了生物神经元对局部区域的敏感性，而池化操作则通过下采样减少特征图的维度，增强了模型对位置变化的鲁棒性。这种设计不仅提高了计算效率，还使得网络能够更好地处理图像中的变换和扭曲。

等变神经网络

等变神经网络网络工作原理示意图 | 来源：Vı́ctor Garcia Satorras， Emiel Hoogeboom， Max Welling

Proceedings of the 38th International Conference on Machine Learning， PMLR 139:9323-9332， 2021.

在分子建模、蛋白质预测、计算机视觉和机器人等领域中，很多数据都具备几何空间上的对称性，如一组点云在旋转、平移或缩放变换下会保持一定的不变性。如果用普通的神经网络技术处理数据就很难捕获到这种几何对称性。于是，人们提出了等变神经网络（Equivariant Neural Networks，EGNN）技术，可以将几何上的对称性作为一个先验偏置编码进神经网络的架构中，使得网络在输入经过某种变换时，输出能够以相应的方式变化，从而保持对称性和不变性。等变神经网络在建模分子结构、模拟多体物理系统、计算机视觉、机器人等领域具有广泛的应用场景，是将几何学、群论和刚体运动等数学、物理学知识应用于神经网络设计的典型案例。

尽管刚刚起步，人工智能和科学研究的深度融合已呈现出“井喷式”增长：不同领域的科学家纷纷将AI融入自己的研究，同时科学领域的研究者也在关注人工智能发展，力求理解其工作原理，以期实现更好的改进。为了梳理这一快速发展的全新领域，上海科学智能研究院、集智科学研究中心和阿里云共同发起了“AI X Science十大前沿观察”项目，希望能够把脉和提炼这一新兴领域的最新发展动态。

在与上海科学智能研究院、复旦大学和集智俱乐部社区中的从事前沿研究的学者深度访谈基础上，我们做了大量的文献梳理，并最终凝练了“AI X Science十大前沿观察”的三个维度和十个具体方向。三个维度包括：AI for Science、Science for AI和基础设施，其中，AI for Science的前沿方向包括基于LLM的科学研究、垂直领域科学大模型、融入先验知识的AI模型、AI科学家、复杂世界的多智能体建模，以及AI仿真与系统模拟；Science for AI的前沿方向则覆盖了物理世界的第一性原理和科学启发的AI新架构；基础设施前沿方向包括合成数据和数据基础设施、新型智能计算。在十个具体方向上，我们梳理出共计35个研究前沿。需要指出的是：这十个方向的具体研究案例未必都是共识的权威成果，但在科学问题设定、方法论建构、精度和效率的提升等方面，这些研究不仅效果显著，且令人耳目一新。展望未来，AI X Science大幕已启，正如DeepMind在2024年11月发布的研究报告所预见，一个科学发现的黄金时代正在到来。

AI X Science十大前沿观察

《AI X Science十大前沿观察》的具体内容，请扫描二维码下载报告全文，并且集智俱乐部公众号也会继续发布各章节详细内容。

扫描二维码下载完整报告

展望

特殊挑战

通观全局，AI X Science尚处起步阶段，但其发展速度却非常迅速。同时，这一领域虽然发展迅猛，但也存在着严重的挑战并蕴含着巨大的机遇。与一般的AI研究领域不同，我们认为，AI X Science在未来可能需要面对两大特殊的挑战：

Science for AI：AI如何与人类共享知识

这既包括如何将专家的知识融入AI系统，也包括如何提高AI系统的可解释性。

目前已知的大量AI系统架构上面的里程碑式进展，往往都伴随着人类将一大类先验知识融入到了AI体系架构的设计之中。例如卷积神经网络（CNN）的架构设计就是融入了空间平移对称性的考虑；基于扩散的生成式模型，则是由扩散物理过程转变而来的一种全新架构。知识图谱、向量数据库等技术则将人类知识转变为一种外部模块，从而被AI系统所应用。然而，这些进展只在一定程度上解决了共享人类专家知识的问题，如何更好地将专家知识转变为AI系统可用的模块、架构或外部知识仍然是未来的重要挑战之一。

其次，随着AI模型的规模越来越大，这些大模型的工作机理将会变得越来越不透明，特别是大模型涌现现象的存在，使得模型能力的提升变得扑朔迷离。因此，如何将AI大模型学习到的知识更好地同步给人类，甚至于找到AI大模型运作的基本原理，则是未来有待解决的另一重大挑战。

我们认为这两个方面的挑战将成为未来Science for AI研究的重要方向。

AI for Science：AI如何具备实验思维

纵观人类数百年的科学活动，做实验是科学研究活动中不可或缺的重要组成部分。如何设计巧妙的实验，从而用最小成本获取最关键信息，是一种不同于被动学习、演绎和推理的全新的思维方式——即实验思维。

然而，目前的科学智能研究绝大部分都集中在如何让AI系统具备人类一样的逻辑思维和基于被动数据的归纳思维模式，却相对缺乏基于干预数据的反事实推理能力，以及与真实世界互动并主动获得数据的能力。之所以出现这一问题，部分原因在于目前的AI系统的犯错误成本过高，因此尚难以具备与真实世界互动的能力。特别是，由于AI系统的不可解释、不透明性，人类难以信任AI系统自行与真实世界互动。这一能力的缺乏才是导致数据稀缺的本质，也将大大限制AI科学家达到人类科学家的水平。

因此，我们认为，未来AI for Science研究的一大挑战将是如何巧妙地设计实验，自主从世界获取新的数据，以促进AI系统的学习，从而更有效的完成学习任务。

科学世界模型框架

为了应对这两大特殊挑战，我们尝试提出一个科学世界模型框架：

科学世界模型框架

该框架包含了两大智能主体和两个交互界面。两大智能主体包括：数据驱动为主的基础模型（Foundation Model）和人机交互为主的深思者（Deep Thinker）。两个交互界面主要包括：人机对齐界面（Human-AI Alignment）和AI-现实互动（AI-Reality Interaction）界面。下面分别展开论述：

数据驱动模型

数据驱动模型是一个单一领域，或跨领域的AI模型，可以通过机器学习的方式从多源、多模态数据之中提取有用的模式和规律。但该基础模型不仅包括学习和建模，理想化的终极形态应该是一个代理模型（Surrogated Model），该模型将可以替代真实的研究对象，从而完成预测、模拟、问题求解等一系列下游任务。

然而，面向科学智能的基础模型还应具备一种全新的能力，即“做实验”——如何为了学到更好的替代模型而直接与真实世界互动，从而获取新的干预数据。这部分干预世界、获取反馈的功能则将专门由实验设计模块（Experiment Designer）完成。考虑到AI与世界互动的成本过高的问题，因此如何在尽可能少而轻地与真实世界互动的前提下，获取更多的有用信息乃至补全数据，将会是实验设计模块的重要任务。

从一定意义上说，基础模型模块所完成的类似于人类大脑中的系统I的功能。但是，与人脑中的系统I不同的是，该基础模型还包括了一定程度上的问题求解能力和实验设计能力。

深思者

目前的AI系统无法替代人类科学家来单独探索世界。我们认为，在今后较长的一段时间内，科学研究仍将通过人类科学家和机器的协作来完成。在数据驱动的模型之外，融合第一性原理、先验知识和领域机理的深度推理模型必不可少，类似o1、o3和R1这些推理模型，以及神经符号体系中的Lean，这就是“深思者”。深思者在一定程度上类似于人脑中的系统II，数据驱动模型需要和“深思者”深度融合，将深度学习的感知和符号推理的严谨、可解释相结合。

一方面，深思者会充分获取人类专家的知识和经验，这包括从大量科学文献中获取知识、完成推理；也包括将人类专家的知识（以知识图谱、概率图模型等形式呈现）存储在单独的处理模块中，并与基础模型深度结合起来；还包括将人类专家的经验性知识、领域的第一性原理以归纳偏置（Inductive Bias，例如对称性的考量等）的方式，转变为基础模型模块融入神经网络架构设计之中，这一功能可通过构建某种通用的神经网络架构设计语言来完成。

另一方面，深思者还需要将基础模型学习到的隐性知识以对人类更友好的方式展示出来，从而与人类科学家对齐。这包括但不限于生成具有启发性和洞察力的科学报告、友好的可视化界面，以及对数据驱动模型思考过程的解释等等，甚至于深思者自发总结的新科学规律。

AI与现实的交互

为了更好地探索真实世界，基础模型主体应具备重要的“做实验”的能力，从而通过主动地与世界互动，以获得更多反馈数据。这一交互过程将主要由AI-现实交互界面完成。

一方面，基础模型应通过“实验设计器”规划出一个如何干预世界以更好地获得信息的方案，再根据这一规划来与真实世界互动。但是，由于现实中的互动往往是成本高昂的（需要考虑到实验成本和犯错误成本），因此这一互动过程并非类似于具身智能那样频繁而直接，它更应该以一种弱交互的方式来干预世界。

另一方面，基础模型应能直接从真实世界获取反馈，这既包括对智能体的评价反馈，也包括从真实世界收集到的全新数据。这些新的数据往往可以反映出对现实世界进行干预之后的反馈，因此也可以被理解为一种干预数据。这些干预数据可以进一步更新到训练数据集之中，从而更好地训练基础模型。这种以主动完成数据收集和机器学习的方式，往往可以获得更好的效果。

人类专家与AI系统的对齐

人类-AI对齐界面主要负责人类与AI系统的信息和知识的共享，从而达到人机能够更好地协作这一重要目的。这包括两方面：

首先，对于任何学科，目前绝大部分知识是掌握在人类专家手中的，因此，如何将人类专家的知识、经验以及一些灵感性的启发式思考，融入基础模型这样的以机器学习为主的系统之中，就是一个亟待解决的难题。尽管目前已普遍应用的知识图谱、向量数据库等技术可以部分解决这个问题，但是，更新的技术仍有巨大的应用潜力。例如，可以根据人类的直觉经验而自动构造神经网络架构、选择合适超参的工具。

其次，可解释性问题仍然是一个桎梏AI发展的重要卡点。如何设计更友好的人机交互界面，从而将AI的思考、推理过程展现给人类是未来待解决的重要问题。