Science | Computational Care：从药物设计新范式到现实中的局限性

DRUGAI

原文链接
https://www.science.org/content/blog-post/computational-care

今年早些时候，一款基于扩散方法的小分子配体对接新程序——DiffDock 引发了广泛关注。这款程序旨在将小分子配体拟合到蛋白质中，并被一些宣传材料形容为“计算药物设计领域的范式转变”。例如，其新闻稿中提到，“该模型采用独特的计算药物设计方法，与目前大多数制药公司使用的先进工具相比，提供了一种颠覆传统药物开发流程的重大机会。”此外，美国国防威胁降低局（MIT项目的资助方之一）称其为“分子对接领域的重大进步，与传统的基于搜索的对接方法相比，在准确性、效率和灵活性方面都有显著提升”。

DiffDock的独特卖点

DiffDock区别于传统方法的关键在于：

传统的分子对接被视为一种回归问题，试图找到单一的“正确答案”，而DiffDock采用扩散模型方法，可以同时生成一系列潜在配体构象。

宣称能够处理蛋白质柔性，提升对接精度。

在更具挑战性的场景中（如计算生成的非结合蛋白质结构），DiffDock据称仍然表现出色，预测的22%结果可以达到2Å以内的准确性（相比之下，其他模型通常只有不到10%的成功率，甚至低至1.7%）。

对DiffDock表现的批评

然而，几乎在这一程序亮相的同时，就有报告对其表现提出了质疑。最近由Optibrium公司（英国剑桥）的Ajay Jain、Ann Cleves以及Relay公司（美国剑桥）的Pat Walters发表的一篇预印本，详细分析了DiffDock与传统对接流程（如Surflex-Dock、Glide、Vina等）之间的表现对比，结果并不理想。

主要发现：

传统方法全面胜出

在已知蛋白结合位点的情况下，传统对接工具远超DiffDock。

即使在未知结合位点的情况下，DiffDock的准确预测数量和与实际结果的接近程度也显著落后。

训练集问题

DiffDock的团队使用了约98%的已知小分子-蛋白质复合物作为训练集，仅保留2%作为测试集。

这种做法显然不合理。合理的比例应是更大的测试集，以确保模型的泛化能力。

由于训练集中包含大量类似于测试集的案例，模型在解决测试问题时很可能已经“见过”或“记住”了类似答案，这与传统对接工具从第一性原理处理问题的方式截然不同。

当去除训练集中与测试案例高度相似的例子后，DiffDock在应对更具挑战性的问题时表现显著下降。

与其他AI方法的相似性

DiffDock的表现问题类似于一些基于深度学习的对接工具（如Gnina），它们可能更多地依赖于对训练集数据的记忆，而非真正理解和泛化。

更广泛的意义

这篇论文不仅揭示了DiffDock的问题，也引发了对AI在药物设计领域局限性的更广泛讨论：

AI在药物设计中的挑战

与AlphaFold处理蛋白质序列-结构问题不同，小分子配体结合蛋白质的化学空间复杂得多，传统机器学习方法在该领域的能力有限。

药物设计的核心目标是创新——发现新蛋白质和新化学分子，而不是简单地复制已知数据。

炒作的后果

类似DiffDock这样的新方法因其“魔术般”的宣传引起广泛关注，但也导致了时间和资源的浪费。

多个团队需要独立验证这些方法的性能，重复劳动大大增加了计算辅助药物设计（CADD）领域的负担。

结论

DiffDock展示了扩散模型方法在分子对接中的潜力，但其当前的表现暴露出深度学习在药物设计中的显著局限性。研究团队和行业需警惕过度宣传对学术和应用领域的负面影响，并在开发新方法时确保其验证和评估的科学性。

这篇论文最后总结道：

“类似DiffDock的研究并非对CADD领域没有代价。这些听起来神奇的主张吸引了大量关注，并需要各团队投入时间进行验证和驳斥。大多数团队，尤其是专注于开发新药物的团队，没有时间发表如此详尽的反驳文章。因此，这种验证/驳斥的工作被多次重复，造成了大量的时间和精力浪费，而药物发现本身已然足够困难。”

这段话发人深省，呼吁药物设计领域保持审慎态度，聚焦科学价值，而非炒作噱头。

整理 | WJM

参考资料

https://www.science.org/content/blog-post/computational-care

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签