集智俱乐部 04月28日 08:17
Nat. Mach. Intell. | 最佳传输模型生成化学反应过渡态
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了深度原理Deep Principle团队研发的React-OT,一种基于最优传输理论的革新性过渡态检索方法。React-OT通过从反应物和产物的结构插值,推导出高度精确的过渡态结构,显著提升了TS搜索的效率与精度。与传统方法相比,React-OT在速度和精度上都有了显著提升,为反应机理研究和催化剂设计提供了新的工具,并展示了其在复杂反应网络探索中的应用潜力。

⚛️ React-OT基于最优传输理论,从反应物和产物的结构插值推导过渡态(TS)结构,实现了单次采样生成确定性TS结构,避免了OA-ReactDiff的随机性问题。

⚡ React-OT使用RGD1-xTB数据集预训练,数据量远超OA-ReactDiff,提升了TS预测精度,RMSD中位数和势垒高度误差降低25%以上,并能适应更复杂的化学反应。

⏱️ React-OT大幅缩短了TS搜索时间,仅需0.4秒即可完成,远快于OA-ReactDiff的6秒,使其在催化剂设计、药物合成和材料探索等领域具有广泛的应用前景。

2025-04-24 22:40 上海

 深度原理 | 作者





在化学的微观世界里,过渡态(TS)就像化学反应中的 "能量高峰"—— 当分子们为了发生奇妙的化学变化而剧烈碰撞时,必须跨越这个转瞬即逝的能量顶峰。然而,这个关键的中间状态就像闪电一样难以捕捉:实验仪器的 "快门速度" 跟不上它的变化节奏,而传统的量子化学计算方法又如同用慢镜头拍摄烟花,即使是最强大的超级计算机,解析一个过渡态的结构也可能需要连续工作数小时甚至数天。这种困境让科学家们在探索复杂反应网络指导化工生产、设计性能更优的催化剂时举步维艰。


图一|二维势能面上的反应物(R),过渡态(TS),产物(P),以及最小能量路径(minimal energy pathway)


近日,深度原理 Deep Principle联合佐治亚理工大学,康奈尔大学等机构联合提出了一种革新性的过渡态检索方法--React-OT,采用最优传输(Optimal Transport, OT)的方法,从反应物和产物的结构插值开始,推导出高度精确的过渡态结构,相关成果已作为封面文章发表在 Nature Machine Intelligence 上,同时MIT News也对文章的第一兼通讯作者,深度原理 Deep Principle创始人兼CTO段辰儒博士进行了专访报道。


本文将带你深入了解 React-OT 的核心原理、与传统方法的对比,以及它如何突破计算化学的瓶颈,大幅提升 TS 搜索的效率与精度,为反应机理研究和催化剂设计提供全新工具。




一、方法创新




🔍从 OA-ReactDiff 到 React-OT


OA-ReactDiff是深度原理 Deep Principle于2023年推出的首个生成3D化学反应的扩散生成模型,这项成果已在Nature大子刊Nature Computational Science上发表,并被选为封面论文。OA-ReactDiff仅依赖反应物和产物的3D几何形状即可生成过渡态结构,比传统量化方法预测过渡态速度提升1000倍。但是由于扩散模型采样过程中的随机性,OA-ReactDiff生成的过渡态也是随机的,往往需要多次采样才能获得理想的过渡态结构。


作为OA-ReactDiff的迭代升级版本,React-OT在OA-ReactDiff的基础上,针对给定的反应物和生成物(双端搜索)进行了改进,基于最优传输理论,通过流匹配方法,从反应物和产物直接推导TS结构,单次采样即可生成确定性的TS结构。


💡最优传输(OT)


最优传输是一种数学理论和计算方法,用于描述两个概率分布之间的距离或者对应关系。它的核心概念是如何以最佳方式将一组资源(如质量、能量等)从一个位置传输到另一个位置。类比初中学习的线性规划问题:三个城市(A, B, C)分别有1、0.5、1.5吨煤,另外有两个城市(D, E)分别需要2、1吨煤,由于不同城市之间的运输成本不同,城市需求也不同,需要制定策略给出最优运输路线,这些“最优路线”在化学反应中就代表了最合理化学反应路径以其对应的过渡态结构。



🌟技术亮点速览


1. 初始过渡态结构:OA-ReactDiff从高斯噪音中随机采样,所以生成的过渡态也存在随机性。React-OT则是从反应物和产物的线性插值出发,并且通过平移旋转等操作确保初始结构的等变性和唯一性,获得相对合理的初始猜测,将采样路径推向更接近最优传输的方向。


2. 采样过程:OA-ReactDiff采用扩散模型,过渡态生成是一个随机采样过程。而React-OT将采样过程模拟为常微分方程,而不是扩散模型中的随机微分方程,将反应物、产物和过渡态的联合分布视为动态传输问题,通过流匹配(flow matching)方法,直接从反应物和产物推导TS结构,不再需要多次随机采样。


3. 更大数据集的预训练:使用RGD1-xTB 数据集对React-OT进行预训练,然后再在Transition 1x数据集上进行模型的微调,RGD1-xTB包含95万个基于 GFN2-xTB 计算的化学反应,对比训练OA-ReactDiff使用的Transition1x 数据集(1 万个反应),RGD1-xTB的数据量大幅增加,可为 React-OT 提供更广泛的化学环境和结构信息。


图二 | 扩散模型和最佳传输模型生成TS结构的工作概述(左)OA-ReactDiff的随机推理过程。(右)React-OT的确定性推理过程





二、结果一览




📈挤爆牙膏的性能提升


在使用Transition 1x训练React-OT之前,先在RGD1-xTB 数据集上对 React-OT进行了预训练,预训练后,React-OT在TS预测精度上实现了显著提升:生成结构的 RMSD 中位数和势垒高度误差降低 25%以上,相比未预训练模型精度提升显著。除了精度的提升之外,搜索过渡态所需运行时间也显著减少。OA-ReactDiff在单张GPU上需6秒完成过渡态搜索,而React-OT的采样过程消除了随机性,只要0.4秒就可以得到正确的TS结构。对比OA-ReactDiff,React-OT能适应更复杂的化学反应类型,对未见过反应的预测能力也要更好。


图三 | React-OT和OA-ReactDiff模型在生成过渡态的精度和速度方面的性能对比 a. React-OT得到满足特定RMSD要求的TS结构的可能性高于两种扩散模型。b. OA-ReactDiff和React-OT生成过渡态的质量。c. 两种模型预测效果的对比。d. 运行速度的比较。


🌐在反应网络中的应用


在经过 RGD1-xTB 预训练后,React-OT显著提升了对未见反应类型的适应性和预测能力,即使在12 个非氢原子的复杂反应体系中,仍能准确生成TS结构,具备应对多步有机反应的能力。为了探索React-OT在反应网络探索中的实际应用,这篇文章选择γ-酮过氧化氢(KHP)作为研究对象。KHP 是一个备受关注的反应体系,近年来被广泛用于基准测试。


图四| KHP的反应网络  其中红色/黑色的数字分别为DFT计算/React-OT生成的过渡态上计算得到的活化能


可以看到,React-OT生成的反应网络与文献记载的KHP反应节点完全一致,表明其能够准确捕捉所有关键反应,且两者的平均绝对能量差仅为 3.84 kcal/mol。这一案例研究展示了 React-OT 在加速反应网络探索中的应用潜力。





三、应用展望




段辰儒表示,“人类眨眼的平均时间是0.4秒。在这个时间内React-OT就可以精准的找到一个化学反应的过渡态,这在之前是不可想象的。极致的加速会产生行为模式的质变,React-OT将改变我们对化学反应的理解和探索新材料的方式。”


💻应用场景前瞻


· 催化剂设计:快速筛选高活性反应路径,加速清洁能源催化剂开发。

· 药物合成:精准预测有机反应能垒,优化合成路线,降低实验成本。

· 材料探索:构建超大型反应网络,发现新型功能材料(如MOFs、钙钛矿)。





未来已来




React-OT标志着化学反应TS搜索进入高效、精准的新纪元,有望成为计算化学领域的重要工具。欢迎关注深度原理 Deep Principle团队,探索更多前沿研究!


拓展阅读:Bohrium Notebook

如果对生成式模型感兴趣,想进一步了解React-OT,复制下方链接,打开 Notebook:

https://bohrium.dp.tech/notebooks/47742251216

也可以通过Bohrium App或者深度原理 Deep Principle(DeepPrinciple)官方使用链接直接试用模型生成你想要的过渡态:

https://bohrium.dp.tech/apps/bohriumweb/job?type=app

深度原理 Deep Principle(DeepPrinciple)官方使用链接🔗:

http://reactot-dev.deepprinciple.com



AI+Science 读书会


AI+Science 是近年兴起的将人工智能和科学相结合的一种趋势。一方面是 AI for Science,机器学习和其他 AI 技术可以用来解决科学研究中的问题,从预测天气和蛋白质结构,到模拟星系碰撞、设计优化核聚变反应堆,甚至像科学家一样进行科学发现,被称为科学发现的“第五范式”。另一方面是 Science for AI,科学尤其是物理学中的规律和思想启发机器学习理论,为人工智能的发展提供全新的视角和方法。
集智俱乐部联合斯坦福大学计算机科学系博士后研究员吴泰霖(Jure Leskovec 教授指导)、哈佛量子计划研究员扈鸿业、麻省理工学院物理系博士生刘子鸣(Max Tegmark 教授指导),共同发起以“AI+Science”为主题的读书会,探讨该领域的重要问题,共学共研相关文献。读书会已完结,现在报名可加入社群并解锁回放视频权限。

详情请见:
人工智能和科学发现相互赋能的新范式:AI+Science 读书会启动



推荐阅读
1. Nature:DeepMind新一代Dreamer架构突破强化学习泛化瓶颈
2. 深度学习解决计算量子化学基本问题,探索物质与光如何相互作用
3. Nat.Commun.速递:集成的自优化可编程化学合成和反应引擎
4. 游戏化科研——让我们突破内卷、共研涌现
5. 探索者计划 | 集智俱乐部2025内容团队招募(全职&兼职)

6. 加入集智,玩转复杂,共创斑图!集智俱乐部线下志愿者招募



点击“阅读原文”,报名读书会

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

React-OT 过渡态 AI 化学反应
相关文章