范阳 04月09日 18:05
谷歌 DeepMind:科学研究的工程化( Engineering for Science )
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章探讨了 DeepMind 的“研究工程”团队,该团队是 AlphaFold 等 AI 成功项目的关键。作者指出,DeepMind 通过构建高效的工具和嵌入研究小组的研究工程师,加速了研究迭代。这种工程与研究并重的模式,使得研究人员能够快速验证想法,并确保代码的可维护性和可扩展性。文章强调了工程能力在“AI for Science”领域的重要性,认为这是推动科学突破的关键因素。

🚀 DeepMind 的“研究工程”团队大约占团队总人数的三分之一,其核心在于构建工具,加速整个研究过程。例如,研究人员可以快速编写代码,在基准测试上运行,并迅速看到结果。

💡 研究工程师也嵌入到具体的研究小组中,每个小组配备 3 至 4 名研究员。这些工程师不仅参与研究构想,实现新方法,还负责确保代码的可维护性和可扩展性,方便团队协作和知识传承。

🛠️ DeepMind 在 AlphaFold 项目中的成功,很大程度上归功于研究工程团队。在项目初期,团队专注于数据工程、评估指标设定和基础设施搭建,从而加速了后续实验的迭代。

📈 作者认为,工程能力是“AI for Science”成功的关键。大规模语言模型的运作本质上是一个分布式计算问题,需要强大的工程能力来支持。

原创 范阳 2025-03-22 17:11 上海

DeepMind 的 “研究工程”( Research Engineering )是做什么的?

继续开源分享让我有启发的阅读和文章。

这篇博客短文来自于 Steve Crossan,他从事 AI 与深度科技领域的研究、投资与创业公司顾问工作。他曾在谷歌 DeepMind 担任产品开发,创立了 Google Cultural Institute( 谷歌文化研究院 ),也曾负责 Gmail 的产品工作。

这篇文章他分享了 DeepMind 的研究者与工程师文化,以及他们是如何协作来解决“科学研究”问题的。希望对你有启发。



科学研究的工程化

Engineering for Science

作者:Steve Crossan

编辑:范阳

发表日期:2024年10月1日


为什么 AlphaFold 是在 DeepMind 而不是( 比如 )Broad Institute 这样的著名科学研究机构实现的?

原因不是数据。大家获取的数据完全相同。

也不是因为算力资源。AlphaFold1 的算力预算完全在学术项目的合理范围之内。

真正的原因在于,我们把它既当作一个研究问题,也当作一个工程问题来对待( we treated it as an engineering problem as much as a research one )。实际上,这正是 DeepMind 的“秘密武器”:大约三分之一的团队成员属于我们称为“研究工程”( Research Engineering )的部门。这是一个独立的组织( 由出色的 Andreas Fijedeland 所领导 ),有着自己的理念,虽然嵌入在学术界的人工智能研究文化中,但同时又保持一定的独立性。这个团队的氛围有点像 Google 的 SRE( Site Reliability engineering,站点可靠性工程 )团队:我们是在机舱里流汗的人,好让上层甲板上的人看起来光鲜亮丽( we’re the ones who sweat in the engine rooms so the top brass can look good on deck )。

DeepMind 的研究工程团队主要做两件事( Research Engineering at DeepMind did 2 things ):

第一部分团队专注于构建工具,让整个研究过程更快更高效( building tools to make all of research go faster )。这意味着,如果某个研究员有了一个新想法,他们可以很快编写代码,并非常容易地在一整套基准测试上运行,往往一天之内就能看到它在排行榜( leaderboard )上的表现。这一部分的工作也负责管理数据资源的访问。

另一部分研究工程师则嵌入在具体的研究小组中。每个由 3 至 4 位研究员组成的小组中都会配备一名研究工程师。这些工程师不仅会参与研究构想,乐于阅读论文并实现新方法的代码,同时还负责确保该小组产出的代码具备良好的可维护性和可扩展性( ensuring that the pod produced maintainable, scalable code ),能够被组织内的其他人顺利接手,并符合更广泛代码库的规范。

这种方法具有复利效应,因为每一轮迭代中构建的工具和实践,会让下一轮进行得更快( tooling and practices built for each iteration make the next go faster )。我相信 OpenAI 的工程人员与研究人员的比例甚至更高( the ratio of engineering to research is higher )。在 GPT 关键论文的作者中( 包括主导研究负责人 ),很多首先是工程师。要让大规模语言模型真正运作起来,本质上是一个分布式计算问题( Getting LLMs to work at huge scale is primarily a problem in distributed computing )——这一点,从 Llama3 论文也能看出来。我最近和那边的一位前同事聊天,他说他认为理想的比例可能应该是 80% 工程 / 20% 研究。我觉得这并不夸张。

AlphaFold 最初是在 DeepMind 的 Applied Group( 应用研究组 )启动的,该组以研究工程师( Research Engineers )为主。在项目的头 9 个月里,团队大部分时间都花在数据工程和清洗( 尤其注重避免无意的数据泄漏 )、设定合适的评估指标,以及搭建实验所需的基础设施。这使得之后的实验迭代非常迅速。而这个从零起步的团队,仅用了两年时间——从 2016 年 4 月开始,到 2018 年 8 月赢得 CASP 比赛。

两年后,AlphaFold2 发布,真正点燃了整个领域的火药桶。之后 RosettaFold、ESMFold 等等迅速涌现。2020 年时,全球科学家共积累了约 20 万个蛋白质三维结构,代表了超过 50 年的科研成果;而在几年之后,可用的结构数量已达到数亿。

所以,当我们谈论 “AI for Science”( AI 赋能科学 )的前景时,必须牢牢记住:工程能力才是 AI for Science 成功的关键之一( the crucial importance of Engineering for AI for Science )。


原文链接:

https://stevecrossan.medium.com/engineering-for-science-c740dff839ca


前文阅读

Arc Institute 与 Convergent Research 深度访谈:FROs、元科学运动、 ARPAs、快速资助。

“自动化科学” (Autonomous Science)的蓝图:AGI 遇见“实验室革命”

唐·布雷本:风险科研 (Venture Research) 如何挑战传统科学资助体制?

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepMind 研究工程 AI for Science AlphaFold 工程能力
相关文章