index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html
![]()
微软AI for Science团队推出的BioEmu是一项重大的科学突破,它能够以惊人的速度模拟蛋白质的动态结构和功能。传统上需要数年GPU时间的毫秒级分子动力学模拟,BioEmu仅需数小时即可完成,效率提升了10万倍。该工具通过海量数据训练,能够准确预测蛋白质在不同状态下的结构变化、稳定性以及突变效应,为药物研发、蛋白质设计等领域带来了革命性的进步。BioEmu的开源将极大地推动相关科学研究的发展,让科学家们能够更深入地理解生命的奥秘。
🔬 BioEmu显著提升蛋白质研究效率:微软推出的BioEmu工具能够模拟蛋白质在平衡状态下的各种可能结构集合,从而深入理解其功能。传统上耗时数年才能完成的毫秒级分子动力学模拟,BioEmu仅需不到1小时即可完成,将蛋白质研究速度提升了10万倍,极大地加速了药物研发进程。
🌟 蛋白质功能与动态结构密切相关:文章强调蛋白质的生物功能与其动态变化的结构(构象)密切相关。蛋白质能够根据需求灵活切换形状,这些构象变化是其发挥作用的基础。BioEmu通过预测蛋白质在不同状态下的结构,帮助研究人员更清晰地了解其工作机制,例如肌动蛋白与ATP结合后发生的构象变化。
📊 BioEmu 1.1的训练与性能:BioEmu 1.1经过三阶段训练,运用了大规模蛋白质结构数据、超过200毫秒的分子动力学模拟数据以及50多万条蛋白质稳定性测量数据。这使其能更准确地预测蛋白质行为,如大规模结构运动、局部结构解开和隐匿密口袋的形成,且预测误差极低,与实验数据高度相关。
🚀 开源与可及性:BioEmu已开源,并遵循MIT许可证。开发者可以通过GitHub获取代码,并从Hugging Face获取模型权重,同时也可以在Azure AI Foundry和Colab Fold上使用。这一举措将极大地促进全球科学家在蛋白质研究、药物发现和蛋白质设计等领域的合作与创新。
【新智元导读】微软「AI for Science」团队推出BioEmu,将蛋白质研究速度提升10万倍!从结构到功能,从折叠到突变,这个开源神器正改变药物研发的未来。来自微软团队研究蛋白质的「模拟神器」BioEmu,今日登上了Science!BioEmu能模拟蛋白质在平衡状态下的各种可能结构集合,为深入理解蛋白质功能提供了关键支持。论文链接:https://www.science.org/doi/10.1126/science.adv9817我们的身体由组织和细胞构成,在纳米尺度,蛋白质是驱动生命活动的微型机器。人类基因组计划能够测序DNA。DNA中有称为基因的片段,基因可以被转录和翻译成一串氨基酸,即蛋白质。根据氨基酸的序列,蛋白质会折叠成三维结构。实验测定蛋白质结构很费时间,但AlphaFold的突破,可以精确预测蛋白质结构。有了可扩展的方法来确定蛋白质序列和结构,但它们的工作原理仍是个挑战。蛋白质的功能是什么?它与结构有什么关系?举个例子:肌动蛋白是形成肌肉纤维的关键蛋白质。像大多数蛋白质一样,肌动蛋白的结构不是固定的。当肌动蛋白结合ATP时,它更倾向于闭合。闭合的肌动蛋白喜欢与其他肌动蛋白结合,形成纤维,这些纤维是肌肉的基础。蛋白质的生物功能取决于它们改变构象的能力,不同构象会影响蛋白质与其他蛋白质的结合。这些构象和它们之间的转变可以通过实验或分子动力学模拟来研究,但这些方法耗时且昂贵。模拟一个小型蛋白质仅一微秒的运动,在一台现代GPU上需要整整两天,且几乎看不到明显运动。只有模拟更长时间(如毫秒级),才能看到重要的功能性变化,如折叠、展开或结合,但这需要数年的计算时间,难以大规模应用。微软研究AI for Science团队推出了BioEMU。使用时,只需输入蛋白质序列,BioEMU就能生成大量蛋白质结构样本,预测蛋白质的各种性质。它可以展示一个受体蛋白在两个已知结构之间的运动,预测大尺度结构变化、局部展开以及药物分子结合位点的形成。BioEMU还能模拟毫秒级分子动力学模拟的结果,传统模拟需要几年GPU时间,而BioEMU只需不到1小时GPU时间,速度提升10万倍!网友评论,「微软研究院的突破令人振奋!在如此规模上对蛋白质平衡集合建模,对药物发现和疾病理解具有重大意义。BioEmu将数年的结构模拟浓缩到数小时内,是一个巨大的飞跃。」「我爱科学,还有有史以来最伟大的发明家,正在以指数级改变我的生活。」
模拟蛋白质动态结构
蛋白质的功能与其动态变化的结构密切相关。它们可以根据需求灵活切换不同形状,这些变化是其发挥作用的基础。BioEmu是一个模拟器,通过预测蛋白质在不同状态下的结构,让我们更清晰地了解其工作机制。BioEmu 1.1经过更长时间、更高强度的三阶段训练,运用了海量数据:大规模蛋白质结构数据;超过200毫秒的分子动力学(MD)模拟数据,相当于计算机模拟蛋白质的运动轨迹;50多万条蛋白质稳定性测量数据。因此,BioEmu 1.1能够更准确地预测蛋白质的行为,捕捉与功能相关的结构变化。像大规模结构运动;局部结构解开;隐匿密口袋(cryptic pockets)的形成,成功率显著提升。超快模拟,误差极低
BioEmu 1.1能模拟毫秒级别的分子动力学平衡分布,速度极快。传统方法可能需要数年GPU时间,而BioEmu 1.1仅需几小时即可完成,极大提升了研究效率。BioEmu 1.1在预测蛋白质稳定性和突变效应表现出色。它让实验测量的稳定性数据和模拟出的结构集合更匹配:预测误差小于1千卡/摩尔;在大量测试数据中,与实验测量的稳定性数据相关性超过0.6;训练数据与测试数据的序列相似度约为50%,预测依然精准。
通过分析结构样本,我们可以了解突变对蛋白质稳定性的影响。
此外,BioEmu 1.1还能准确预测单个和双重突变的稳定性变化。即使面对复杂的突变情况,它也能通过精细的数据训练,捕捉细微差异,做出可靠预测。BioEmu的训练依托于超过100毫秒的分子动力学模拟数据集,涵盖数千种蛋白质系统和数万个突变体。这个数据集兼具序列多样性和长时间模拟的优势,数据量大、质量高,为BioEmu的出色表现提供了坚实基础。BioEMU为大规模研究蛋白质功能打开了大门,助力药物发现、蛋白质设计。BioEMU已开源(MIT许可证),可在Azure AI Foundry和Colab Fold使用。开发者可以从GitHub获取代码,从Hugging Face获取模型权重。https://x.com/MSFTResearch/status/1943373860012744737https://www.science.org/doi/10.1126/science.adv9817 文章原文