DRUGAI

原文链接

https://www.science.org/content/blog-post/computational-care

今年早些时候,一款基于扩散方法的小分子配体对接新程序——DiffDock 引发了广泛关注。这款程序旨在将小分子配体拟合到蛋白质中,并被一些宣传材料形容为“计算药物设计领域的范式转变”。例如,其新闻稿中提到,“该模型采用独特的计算药物设计方法,与目前大多数制药公司使用的先进工具相比,提供了一种颠覆传统药物开发流程的重大机会。”此外,美国国防威胁降低局(MIT项目的资助方之一)称其为“分子对接领域的重大进步,与传统的基于搜索的对接方法相比,在准确性、效率和灵活性方面都有显著提升”。

DiffDock的独特卖点

DiffDock区别于传统方法的关键在于:

    传统的分子对接被视为一种回归问题,试图找到单一的“正确答案”,而DiffDock采用扩散模型方法,可以同时生成一系列潜在配体构象。

    宣称能够处理蛋白质柔性,提升对接精度。

    在更具挑战性的场景中(如计算生成的非结合蛋白质结构),DiffDock据称仍然表现出色,预测的22%结果可以达到2Å以内的准确性(相比之下,其他模型通常只有不到10%的成功率,甚至低至1.7%)。

对DiffDock表现的批评

然而,几乎在这一程序亮相的同时,就有报告对其表现提出了质疑。最近由Optibrium公司(英国剑桥)的Ajay Jain、Ann Cleves以及Relay公司(美国剑桥)的Pat Walters发表的一篇预印本,详细分析了DiffDock与传统对接流程(如Surflex-Dock、Glide、Vina等)之间的表现对比,结果并不理想。

主要发现:


传统方法全面胜出

    在已知蛋白结合位点的情况下,传统对接工具远超DiffDock。

    即使在未知结合位点的情况下,DiffDock的准确预测数量和与实际结果的接近程度也显著落后。


训练集问题

    DiffDock的团队使用了约98%的已知小分子-蛋白质复合物作为训练集,仅保留2%作为测试集。

    这种做法显然不合理。合理的比例应是更大的测试集,以确保模型的泛化能力。

    由于训练集中包含大量类似于测试集的案例,模型在解决测试问题时很可能已经“见过”或“记住”了类似答案,这与传统对接工具从第一性原理处理问题的方式截然不同。

    当去除训练集中与测试案例高度相似的例子后,DiffDock在应对更具挑战性的问题时表现显著下降。


与其他AI方法的相似性

DiffDock的表现问题类似于一些基于深度学习的对接工具(如Gnina),它们可能更多地依赖于对训练集数据的记忆,而非真正理解和泛化。

更广泛的意义

这篇论文不仅揭示了DiffDock的问题,也引发了对AI在药物设计领域局限性的更广泛讨论:


AI在药物设计中的挑战

与AlphaFold处理蛋白质序列-结构问题不同,小分子配体结合蛋白质的化学空间复杂得多,传统机器学习方法在该领域的能力有限。

药物设计的核心目标是创新——发现新蛋白质和新化学分子,而不是简单地复制已知数据。


炒作的后果

类似DiffDock这样的新方法因其“魔术般”的宣传引起广泛关注,但也导致了时间和资源的浪费。

多个团队需要独立验证这些方法的性能,重复劳动大大增加了计算辅助药物设计(CADD)领域的负担。

结论

DiffDock展示了扩散模型方法在分子对接中的潜力,但其当前的表现暴露出深度学习在药物设计中的显著局限性。研究团队和行业需警惕过度宣传对学术和应用领域的负面影响,并在开发新方法时确保其验证和评估的科学性。

这篇论文最后总结道:

“类似DiffDock的研究并非对CADD领域没有代价。这些听起来神奇的主张吸引了大量关注,并需要各团队投入时间进行验证和驳斥。大多数团队,尤其是专注于开发新药物的团队,没有时间发表如此详尽的反驳文章。因此,这种验证/驳斥的工作被多次重复,造成了大量的时间和精力浪费,而药物发现本身已然足够困难。”

这段话发人深省,呼吁药物设计领域保持审慎态度,聚焦科学价值,而非炒作噱头

整理 | WJM

参考资料

https://www.science.org/content/blog-post/computational-care