智源研究院 19小时前
DrugCLIP:AI驱动超高通量虚拟筛选引擎,开启后AlphaFold时代创新药物发现新篇章
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

清华大学智能产业研究院(AIR)-北京智源人工智能研究院发布的DrugCLIP平台,利用AI驱动超高通量药物虚拟筛选,实现了百万倍的速度提升和预测准确率的显著突破。该平台打通了从AlphaFold结构预测到药物发现的关键通道,首次完成了覆盖人类基因组规模的药物虚拟筛选。DrugCLIP平台免费开放,为药物研发领域带来了新的可能性,并推动了后AlphaFold时代的药物发现。

🚀 DrugCLIP平台的核心在于其创新的向量化结合空间构建,将蛋白口袋与小分子转化为高效的向量检索问题。该模型结合对比学习、3D结构预训练和多模态编码技术,实现了对蛋白-配体相互作用的精准建模。

🔬 DrugCLIP在多个公开数据集上表现优异,在BEDROC、EF1%、AUC等关键指标上均优于传统对接工具及AI方法,展现出在早期药物发现方面的领先能力。团队通过实验验证,证明了DrugCLIP筛选结果的生物学可信度。

🌐 DrugCLIP首次完成了人类基因组规模的虚拟筛选项目,覆盖约1万个蛋白靶点、2万个结合口袋,分析超过5亿个小分子,构建了目前已知最大规模的蛋白-配体筛选数据库。该数据库已面向全球科研社区开放。

💡 DrugCLIP支持对AlphaFold预测的蛋白结构和apo状态下的蛋白口袋进行筛选,扩大了其在真实药物发现场景中的适用性。平台免费开放,用户无需本地部署,通过网页上传蛋白结构即可启动筛选任务。

2025-06-16 12:00 北京

在2025北京智源大会,清华大学智能产业研究院(AIR-北京智源人工智能研究院「健康计算联合研究中心」发布AI驱动的超高通量药物虚拟筛选平台 DrugCLIP,该平台系统由AIR兰艳艳教授牵头研发。兰艳艳教授系智源青年学者,青源会发起成员。

DrugCLIP 在筛选速度对比传统方法实现了百万倍提升,同时在预测准确率上也取得显著突破。依托该平台,团队打通了从 AlphaFold 结构预测到药物发现的关键通道,首次完成了覆盖人类基因组规模的药物虚拟筛选,为后 AlphaFold 时代的创新药物发现带来了新的可能性。

DrugCLIP:https://www.drugclip.com 

药物研发长期以来面临「高风险、高投入、低成功率」的难题,在靶点发现与先导化合物筛选阶段,受限于传统工具的计算能力,绝大多数潜在靶点和化合物仍未被充分探索。

人类基因组编码 2 万余个蛋白,每个蛋白可能包含多个结合口袋,然而现有药物靶点开发只覆盖其中小部分。另一方面,理论上可合成的小分子数量高达1060,远超现有药物化合物库。

如何在如此浩瀚的生物与化学空间中精准高效地发现活性化合物,是当前创新药物研发面临的核心挑战。以筛选 1 万个蛋白质靶点、每个靶点面对 10⁹ 个候选分为例,需完成约10¹³次蛋白-配体打分。即便使用当前最先进的分子对接工具,也需数百年才能完成,严重制约了新靶点与新分子之间匹配的探索效率。

图:化学空间大小示意图(引用:Gastreich, M. BioSolveITDrugSpace2022)

为突破虚拟筛选规模瓶颈,DrugCLIP 创新性地构建了蛋白口袋与小分子的「向量化结合空间」,将传统基于物理对接的筛选流程转化为高效的向量检索问题。该模型结合对比学习、3D 结构预训练与多模态编码技术,能在三维结构层⾯精准建模蛋白-配体间的相互作⽤。

训练后的高潜力分子将自然聚集于目标蛋白口袋的向量邻域,能够有效支撑快速的大规模虚拟筛选。依托这⼀机制,DrugCLIP 在 128 核 CPU + 8 张 GPU 的计算节点上,能实现毫秒级打分与万亿级日吞吐能力,筛选 100 万个候选分子仅需 0.02 秒,日处理能力达 31 万亿次,对比传统方法实现了百万倍提升。

图:DrugCLIP 编码及检索流程

DrugCLIP 在多个公开数据集上表现优异。以 DUD-E 与 LIT-PCBA 为例,DrugCLIP 在 BEDROC、EF1%、AUC 等关键指标上均优于传统对接工具(如 AutoDock Vina)及近年来代表性 AI 方法,展现出在早期药物发现方面的领先能力。

图:公共数据集评测效果对比

团队与清华大学闫创业教授团队合作,在去甲肾上腺素转运体(NET)的临床相关靶点上开展了系列生物实验验证。 NET 是抑郁症、注意缺陷多动症以及疼痛等疾病的重要靶点,目前虽然有多款抑制剂已经上市,但是在选择性等方面仍然有巨大的优化空间。团队使用DrugCLIP 模型从 160 万个候选分子中筛选出约 100 个高评分分子,同位素配体转运实验检测显示其中 15% 为有效抑制剂,其中 12 个分子结合能力优于现有抗抑郁药物安非他酮。相关复合物结构已通过冷冻电镜解析,进一步验证了 DrugCLIP 筛选结果的生物学可信度。

图:冷冻电镜解析的 NET 与筛选到的分子复合物结构与对应化合物的 IC50 

特别的是,DrugCLIP 支持对 AlphaFold 预测的蛋白结构和 apo(无配体)状态下的蛋白口袋进行筛选,扩大了其在真实药物发现场景中的适用性。团队和清华⼤学刘磊教授团队合作针对 E3 泛素连接酶 TRIP12(thyroid hormone receptor interactor 12)进行了虚拟筛选与实验验证。TRIP12 在肿瘤细胞中促进重要抑癌基因 TP53 的降解,因此其抑制剂可能有抗肿瘤的潜力。

TRIP12 也参与降解葡糖脑苷脂酶(glucocerebrosidase),进而引发α-突触核蛋白(α-synuclein)的积累和聚积,因此其抑制剂对帕金森综合征等神经退行性疾病有潜在疗效。TRIP12 发挥酶活性的 HETC 结构域目前尚无任何文献报导的抑制剂与可供虚拟筛选使用的实验结构。

团队使用 DrugCLIP 模型从160万个候选分⼦中高通量筛选出约 50 个⾼评分分⼦,SPR 实验证实其中 10 个分子与 TRIP12 有结合能力,两个亲和力较高的分子也对 TRIP12 的泛素连接酶活性有一定的抑制活性。

图:AlphaFold2 预测的 TRIP12 结构与筛选获得的其中⼀个化合物的 SPR 曲线

构建人类蛋白组筛选数据库,推动后 AlphaFold 时代药物发现新范式依托 DrugCLIP,团队首次完成了人类基因组规模的虚拟筛选项目,覆盖约 1 万个蛋白靶点、2 万个结合口袋,分析超过 5 亿个小分子,富集出 200 万余个高潜力活性分子,构建了目前已知最大规模的蛋白-配体筛选数据库。该数据库已⾯向全球科研社区开放,为基础研究与早期药物发现提供了强大数据支持。

DrugCLIP 平台现已免费开放,用户无需本地部署,通过网页上传蛋白结构即可启动筛选任务。平台集成口袋/分子编码、向量检索、可视化与结果分析等功能,支持多种分子库调用与自定义上传,广泛适用于科研机构与企业用户。

DrugCLIP 链接:https://www.drugclip.com

图:人类基因组规模的蛋白虚拟筛选数据库

图:人类基因组规模筛选项目覆盖的蛋白数目与现有数据库对比(左:覆盖的靶蛋白空间,使用 ESM1b 编码并进行 t-SNE 降维可视化;右:覆盖的 UniProt ID 数量)

北京智源人工智能研究院研发的全原子微观生命模型OpenComplex2,今年3月亮相中关村论坛,5月发布技术报告,实现了生物分子研究从静态结构预测到动态构象分布建模的重大突破。OpenComplex2为原子级结构生物学提供了一种全新的建模工具,通过统一框架解码生物分子系统的动态作用机制,有望加速从基础分子机制研究到药物设计等下游应用的发展。

图:以 OpenComplex为基座能力,DrugCLIP 将进一步迭代和升级,为药物筛选提供「双轮」驱动

未来,DrugCLIP与OpenComplex2将同科研产业生态合作伙伴深度合作,在抗癌、传染病、罕见病等方向加速新靶点与 First-in-class 药物的发现。

团队将持续优化引擎性能、拓展支持模态,助力构建⼀个更智能、高效与普惠的全球药物创新生态。

联系方式:qwye@baai.ac.cn

阅 读 更 多

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DrugCLIP 药物筛选 人工智能 AI制药
相关文章