机器之心 19小时前
微软研究院BioEmu登上Science,用生成式AI重塑蛋白质功能研究
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

微软研究院发布了名为 BioEmu 的生成式深度学习模型,该模型能够高效且精确地模拟蛋白质的构象变化。BioEmu 结合了 AlphaFold 预测的静态结构、分子动力学模拟数据和实验数据,在单张 GPU 上每小时生成上千个独立蛋白质结构。它不仅能模拟蛋白质在功能过程中的关键结构变化,还能在自由能预测和突变体稳定性变化预测方面表现出色。BioEmu 的开源发布为蛋白质科学和药物设计提供了新的研究工具和资源,有望加速相关领域的进展。

🧬 BioEmu 基于扩散模型架构,结合 AlphaFold 的 evoformer 编码器,能够高效地从蛋白质构象分布中采样,从而模拟蛋白质的动态变化。

🔑 BioEmu 能够模拟蛋白质在功能过程中出现的关键结构变化,如隐性口袋、局部解折叠和结构域重排,这对于理解蛋白质功能至关重要。

🔬 BioEmu 在自由能预测方面达到 1 kcal/mol 的误差水平,与实验数据高度一致,且相比分子动力学模拟实现了数量级的加速,这意味着更快的计算速度和更高的效率。

🧪 BioEmu 对突变体的稳定性变化(ΔΔG)预测表现出色,平均绝对误差低于 1 kcal/mol,Spearman 相关系数超过 0.6,这有助于预测蛋白质的稳定性,从而加速药物研发。

🌍 BioEmu 已在 GitHub 和 HuggingFace 上开源了模型参数和代码,并在 Azure AI Foundry 和 ColabFold 等平台部署,方便用户使用,同时也促进了开放科学的发展。


7 月 10 日,微软研究院 AI for Science 团队在《Science》杂志发表了题为「Scalable emulation of protein equilibrium ensembles with generative deep learning」的研究成果。



论文https://www.science.org/doi/10.1126/science.adv9817

代码github.com/microsoft/bioemu

模型https://huggingface.co/microsoft/bioemu

评估基准github.com/microsoft/bioemu-benchmarks

ColabFold:https://colab.research.google.com/github/sokrypton/ColabFold/blob/main/BioEmu.ipynb

AI Foundryhttps://ai.azure.com/catalog/models/BioEmu


该研究提出了一种名为 BioEmu 的生成式深度学习模型,能够以前所未有的效率和精度模拟蛋白质的构象变化,为理解蛋白质功能机制和加速药物发现打开了新路径。


从结构预测到功能模拟:蛋白质研究的下一个前沿

近年来,AlphaFold 等模型在蛋白质结构预测方面取得了突破性进展,但这些方法通常只能预测单一静态结构,难以捕捉蛋白质在功能过程中所经历的动态变化。蛋白质并非静止不动的分子,而是处于不断变化的构象系综(conformational ensemble)中,其功能往往依赖于这些结构之间的转换。


BioEmu 正是为了解决这一挑战而生。它通过结合 AlphaFold 数据库中的静态结构、超过 200 毫秒的分子动力学(MD)模拟数据,以及 50 万条蛋白稳定性实验数据,训练出一个能够在单张 GPU 上每小时生成上千个独立蛋白质结构的生成模型。



视频:BioEmu生成的蛋白质动态构象展示


生成式建模

BioEmu 承接自微软研究院的前期工作 DiG(Distributional Graphormer),基于扩散模型架构,结合 AlphaFold 的 evoformer 编码器和二阶积分采样技术,能够高效地从蛋白质构象分布中采样。其核心创新在于:


能够模拟蛋白质在功能过程中出现的关键结构变化,如隐性口袋、局部解折叠和结构域重排;



在自由能预测方面达到 1 kcal/mol 的误差水平,与毫秒级 MD 模拟和实验数据高度一致,相比分子动力学模拟实现了若干个数量级的加速;



对突变体的稳定性变化(ΔΔG)预测表现出色,平均绝对误差低于 1 kcal/mol,Spearman 相关系数超过 0.6。



开源发布

研究团队已在 GitHub 和 HuggingFace 上开源了模型参数和代码,还发布了超过 100 毫秒的 MD 模拟数据,涵盖数千个蛋白系统和数万个突变体,为后续研究提供了丰富资源。BioEmu 也部署在了 Azure AI Foundry 和 ColabFold 等平台,使得用户可以便捷地运行模型。



展望未来:从单体蛋白到多分子系统

BioEmu 的开源发布也标志着微软在推动开放科学方面迈出的重要一步。目前,BioEmu 的建模对象主要是单体蛋白质。研究团队正在探索将其扩展到蛋白质复合物、蛋白-配体相互作用等更复杂的生物体系,并结合实验数据进一步提升模型的泛化能力和可解释性。在蛋白质科学、药物设计和合成生物学等领域,BioEmu 有望成为连接结构与功能、理论与实验的桥梁。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


文章原文

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

BioEmu 蛋白质 深度学习 药物研发 AI
相关文章