36氪 - AI相关文章 07月22日 11:19
谷歌AlphaFold得了诺奖,但DeepMind根本没引用前人论文?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

AlphaFold因其在蛋白质结构预测上的突破性成就而广受赞誉,甚至获得诺贝尔奖。然而,近期有观点指出,其核心技术原型早在2016年就已由Vladimir Golkov博士在其NeurIPS会议报告中提出,利用深度神经网络从共进化数据中预测蛋白质接触图,并在CASP11测试中表现优异。该研究的导师Daniel Cremers教授对此表示质疑,认为DeepMind的AlphaFold项目忽视了这项奠基性工作。AI界泰斗Yann LeCun和Pierre Baldi也对此发表看法,强调科学思想的传播性和演进性,指出深度学习在蛋白质预测领域的应用可追溯至更早时期,好的想法并非凭空出现。此事引发了对科研成果引用和知识产权的讨论。

💡 AlphaFold的“原型”技术早在2016年NeurIPS会议上由Vladimir Golkov博士提出,其方法利用深度神经网络直接从共进化数据预测蛋白质接触图,并在CASP11测试中表现出色,该方法被认为是AlphaFold早期技术的基础。

🤔 Daniel Cremers教授,作为Golkov博士的导师,对DeepMind的AlphaFold项目未引用其团队2016年的奠基性研究表示质疑,认为诺贝尔奖委员会可能遗漏了这项重要的前驱工作,引发了关于研究引用和学术诚信的争议。

🔄 深度学习在蛋白质结构预测领域的应用并非AlphaFold独创,Yann LeCun和Pierre Baldi等AI领域专家指出,早在1990年代的雪鸟研讨会以及2000年Pierre Baldi使用循环网络预测蛋白质接触图的研究,都表明深度学习在生物信息学中的应用历史悠久,好的科学想法往往是逐步演进和传播的。

🔬 AlphaFold 1和AlphaFold 2的成功,尤其是AlphaFold 2在CASP上的高精度预测,解决了生物化学领域长期存在的难题。然而,追溯其技术源头,厘清早期研究的贡献,有助于更深入地理解AI在生命科学领域的逻辑和未来发展潜力,并关注核心研究背后的贡献者。

🌐 尽管AlphaFold是一项非凡的成就,但其并非孤立的贡献。科学思想的传播和改进是常态,有时其起源难以追溯。DeepMind的AlphaFold项目在发展过程中,可能独立发现了类似技术思路,但其研究成果的发布晚于2016年的相关研究,引用前人成果是学术研究的基本规范。

AlphaFold夺诺奖引争议!2016年,一位博士生在NeurIPS提出的研究,或许正是AlphaFold的「原型」。如今,导师Daniel Cremers发声,质问为何DeepMind忽略这项研究、不加以引用?

AlphaFold因获得诺奖而声名大噪。

在大多数情况下,AlphaFold 2的预测精度几乎可与X射线晶体学相媲美,令人震撼。

生物化学界持续了半个世纪的难题,终于被攻克。

但2016年,Vladimir Golkov博士在NeurIPS大会上就提出,利用深度神经网络从共进化数据中直接预测蛋白质接触图。

在CASP 11测试中,这套方法优于当时其他的所有方法,堪称AlphaFold的「原型」。

最近,慕尼黑机器学习中心主任、慕尼黑工业大学教授Daniel Cremers表示他们团队为AlphaFold获得诺贝尔奖奠定了基础。

如今,Daniel Cremers发问:为何历史上这块奠基石被忽视了?

我们来一探究竟。

AlphaFold雏形其实2016年就已出现

在2018年12月,在第13届蛋白质结构预测关键评估CASP(Critical Assessment of protein Structure Prediction)中,AlphaFold 1惊艳亮相,排名第一。

2020年11月,AlphaFold 2在CASP上,大放异彩,中位分数为92.4,接近满分100分;2024年5月8日,AlphaFold 3发布。

但早在2016年AI顶会NeurIPS上,Vladimir Golkov就蛋白质预测作了全会报告。

当时提出的方法论包括:

针对目标氨基酸序列,调用已知三维结构的序列数据库

采用隐马尔可夫模型(HMM)进行多序列比对以识别同源序列

计算突变对共进化统计量

训练深度神经网络直接从原始共进化数据预测蛋白质接触图

在CASP11数据集上的系统评估表明,该方法在精度和速度上均显著超越当时最优技术

这项研究汇聚了深度学习与蛋白质预测领域的多位先驱,包括Thomas Brox、Alexey Dosovitskiy和Jens Meiler等合作者。

论文链接:https://papers.nips.cc/paper_files/paper/2016/file/2cad8fa47bbef282badbb8de5374b894-Paper.pdf

值得玩味的是,在报告结尾,Vladimir已预见性地指出:「架构优化与Scaling将进一步提升性能」——

这与AlphaFold团队的后续突破不谋而合。

至于未被引用的原因,至今尚无定论。

可观看Vladimir当年20分钟的报告,了解更多蛋白质预测的完整发展脉络:

2024年, Demis Hassabis(下图左)和John Jumper(下图右)因蛋白质结构预测的贡献,荣获诺贝尔化学奖。

诺贝尔奖委员介绍了AlphaFold 2的工作原理,大致如下:

序列比对:系统从数据库中寻找与输入序列相似的蛋白质,这些序列可能来自不同物种。通过比对,程序揭示了氨基酸之间的潜在联系。例如,当某个位置突变时,可能与另一个位置的变化相关。

距离图生成:基于序列比对中的相关性信息,程序生成一个距离图,显示氨基酸在空间中的相对距离。

三维结构预测:程序将距离图转换为三维结构,最终以高精度预测蛋白质的形状。

AlphaFold 2的工作原理示意图

Daniel Cremers认为所谓AlphaFold的核心技术思路,其实早已完整呈现在他们2016年的论文中。

他感觉诺贝尔奖委员会可能遗漏了他们的奠基性工作。

对此,AlphaFold 1核心团队成员Hugo Penedone提供了AlphaFold诞生初期的一些历史细节。

DeepMind的诺奖,真的忽视了前人的贡献?

AlphaFold 1初始团队的成员Hugo Penedone则还原了DeepMind的开发时间线。

2015年7月–2019年8月,Hugo Penedone在谷歌DeepMind工作,从事深度学习与强化学习的应用研究

据他回忆,大约在2016年3月,DeepMind启动了AlphaFold 1,起因是在一次内部黑客马拉松Hackathon上,尝试将深度强化学习和优化算法应用于FoldIt游戏。

之后的几个月里,他们开始探索接触图(contact map)预测的可能性。

来自副溶血性弧菌(Vibrio parahaemolyticus)的蛋白质VPA0982的蛋白质接触图

由于在早期文献中,接触图已有相关概念,他们意识到,相较于直接预测整个蛋白质结构,使用神经网络来预测接触图的准确率更高。

因此,他认为DeepMind可能在2016年也独立地提出了这个不错的思路。

DeepMind的论文发布远晚于2016年NeurIPS的相关研究,显然,他们应该在工作中引用这些前人的成果!

AI学术大佬怎么看?

针对此事,AI界当代最著名巨擘之一、Meta AI实验室灵魂人物Yann LeCun也表达了看法。

LeCun提到,1990年代的雪鸟研讨会(Snowbird Workshop)(ICLR的前身),使用机器学习进行生物信息学研究的整个想法就已诞生。

其中,与会者包括Anders Krogh(哥本哈根大学教授)、Pierre Baldi(加州大学欧文分校教授)、Richard Durbin(剑桥大学遗传学教授)、David Haussler(加州大学圣克鲁兹分校基因组学研究所科学总监)等人。

在AlphaFold之前,已有若干使用神经网络进行蛋白质结构预测的研究工作。

LeCun直言,没有贬低「AlphaFold贡献」的意思。

值得注意的是,最早在这个领域开展工作的是1990年代雪鸟研讨会与会者之一的加州大学欧文分校的Pierre Baldi。

他在2000年使用循环网络预测蛋白质接触图。

论文地址:https://pubmed.ncbi.nlm.nih.gov/11120677/论文地址:https://pubmed.ncbi.nlm.nih.gov/10871264/论文地址:https://pubmed.ncbi.nlm.nih.gov/10869034/

远早于深度学习变得流行之前。

LeCun一句话,引人深思:

好的想法很少凭空出现。它们以某种方式传播和改进,有时甚至难以追溯其起源。

LeCun直言,同样,AlphaFold是一项具有巨大影响力的非凡成就,但并非孤立的贡献。

最早在这个领域开展工作的加州大学欧文分校教授Pierre Baldi也表达了看法。

Pierre Baldi谈到,深度学习在某种蛋白质结构预测中的首次应用是在20世纪80年代。

当时,是由Qian和Sejnowski针对更简单的蛋白质二级结构预测问题开展的工作。

论文地址:https://pubmed.ncbi.nlm.nih.gov/3172241/

这样来看,用于预测接触图和蛋白质结构的深度学习方法,确实比AlphaFold早了二十年。

梳理来看,仔细查阅文献就会发现,用于预测接触图的深度学习方法,对图神经网络的发展也起到了重要作用。

「早在DeepMind之前,这些方法还被用于学习如何下围棋,而这一点DeepMind从未承认过。」Baldi指出。

Pierre Baldi直言不讳,「从长远来看,科学关乎真理与美。而在短期内,它是一项相当肮脏的人类事务。」

LeCun补充说道,「好的想法很少凭空出现。它们以某种方式传播和改进,有时甚至难以追溯其起源。」

同样,AlphaFold是一项具有巨大影响力的非凡成就,但并非孤立的贡献。

AlphaFold的成功固然值得赞誉,但正本清源,厘清其技术源流,更有助于理解AI在生命科学的深层逻辑和未来潜力。

当好的想法和研究推动社会发展时,希望更多人也能多关注核心研究背后的故事与核心人物。

正是他们的默默付出与耕耘,才有了能与大家见面的「奇迹」的诞生,推动社会向好发展。

参考资料:

https://www.linkedin.com/feed/update/urn:li:activity:7345745870526541824/

https://www.linkedin.com/feed/update/urn:li:activity:7346665613387325442/

https://learn.microsoft.com/de-de/shows/neural-information-processing-systems-conference-nips-2016/protein-contact-prediction-from-amino-acid-co-evolution-using-convolutional-networks-graph-value

https://www.nobelprize.org/uploads/2024/11/fig2_ke_en_24-5.pdf

本文来自微信公众号“新智元”,作者:新智元,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AlphaFold 蛋白质结构预测 深度学习 NeurIPS 诺贝尔奖
相关文章