范阳 04月09日 19:06
FutureHouse 创始人:如何在生物学领域创造 AI 科学家?人类科学家的未来工作是?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了 FutureHouse,一个由埃里克·施密特资助的非营利科研组织,致力于开发“AI 科学家”,以自动化科学研究流程,加速生物学等领域的创新。文章探讨了 FutureHouse 的运作模式、技术框架以及对未来科学家角色的展望,强调开放科学的重要性,并分享了 FutureHouse 在构建AI工具和解决实验瓶颈方面的挑战与进展。

💡 FutureHouse 致力于构建“AI 科学家”,通过自动化科学假设生成与验证,加速生物学等领域的创新。

⚙️ FutureHouse 采用“聚焦研究组织”模式,结合初创企业的敏捷性与开放科学理念,旨在解决重大的学术挑战。

🔬 FutureHouse 构建了四层 AI 科学家框架:工具层、AI 助理层、AI 科学家层和人类层,实现自动化研究流程并保留人类监督。

🚀 FutureHouse 已发布 PaperQA 等工具,并在文献检索等任务中展现出超人类性能,推动科学发现。

🤔 未来人类科学家将更多地负责战略决策,与 AI 协作,加速科学研究的进程。

原创 范阳 2025-03-27 18:27 上海

“ 为了科学野心,为了真理之爱。”

今天有位朋友一起喝咖啡交流,提出了一个很现实又很好的问题, AI4Science ( 人工智能驱动的科学研究 )到底如何赚钱?
我想这个问题现在没有确定的答案,也取决于一个人看待它的视角和位置。过去一段时间可以掌控从“应用科学过渡到商业化研究”( from applied science to commercializable research ) 最成功的组织是 OpenAI ,但它也还没有最终成功,同样的一开始没有考虑赚钱并且被外界当作玩票性质的 DeepSeek 反而开始渐入佳境。是什么驱动他们背后的这群人做这些事情呢?在其他自然科学和基础科学的领域,类似于 OpenAI 这样的“非常规”机构正在被一些有不同想法的人创建。
FutureHouse 是生命科学领域新型科研机构的代表,同样的它并不是一个盈利性的商业公司,甚至很多做法和想法看起来是“有点傻的”,至少是“反商业的”,或者说,还没有被市场所理解。这些组织最终会变成定义这个时代的(商业)机构吗?这是个迷人的命题。
延伸阅读:打造 AI 科学家:FutureHouse 如何推动大规模科学智能 | Asimov Press 独家采访
今天分享的这篇文章来自于科技博客 Decoding Bio 对 FutureHouse CEO Sam Rodriques 的专访,他分享了自己作为一个“新人”是如何从思考未来的科研组织的模式,到认识埃里克·施密特一起落地了 FutureHouse 这个聚焦研究组织,到他们是如何搭建团队和创造自动化科研系统,以及展望了未来人类科学家工作的模式和核心任务。
我想到了最近看到的一位 MIT 的年轻研究者分享的一段话,非常喜欢,我觉得是这一代 researcher founders / builders ( 研究型创始人和创造者 )最好的注脚:

“ 两条鲸鱼千里迢迢来相见;  

它们点头打招呼;  

没想到你也想着这事;  

我不是想着,是着了魔——  

连呼吸都带着这个念头;  

可你是怎么走上这条求知路的,老兄;  

为了科学野心,为了真理之爱。  

two whales travel afar to meet each other; 
they greet with nods; 
I didn't know you were thinking of this; 
I'm not thinking about it, I'm obsessed - the air I breathe is this idea; 
but how did you get on this intellectual journey, my friend; 
scientific ambition, and love of truth.”

希望今天的文章对你有启发。


生物学的扩展 003:
采访 FutureHouse 联合创始人兼 CEO 萨姆·罗德里格斯
Scaling Biology 003: Sam Rodriques, Co-Founder and CEO at FutureHouse
采访人:Zahra Khwaja,DECODING BIO 主理人之一
编辑:范阳
发表日期:2025年1月10日

随着大型语言模型( LLMs )日益崛起并变得愈加智能,正在重新塑造我们日常工作的方式,人们开始关注一个重要问题:它们是否能够加速并推动突破性的科学发现( to accelerate and enable groundbreaking scientific discoveries )。在这一探索前沿,有一个名为 FutureHouse 的组织正致力于挖掘这些可能性。本文将探讨他们在这一令人振奋领域中的独特方法和当前进展。

FutureHouse 正在开创一项前沿事业:开发一位“AI 科学家”( an AI scientist )——一个旨在自动化科学假设的生成与验证过程的系统,目标是在生物学及其他复杂科学领域中加速创新步伐( a system designed to automate the process of scientific hypothesis generation and testing, with the goal of accelerating the pace of innovation in biology and other complex sciences )。

FutureHouse 的模式类似于“聚焦研究组织”( FRO,Focused Research Organisation ):它是一个非营利组织,致力于开放科学 ( open science )。与传统学术机构不同,FutureHouse( 以及 FROs )以初创企业的敏捷性、资源配置和团队架构,攻克具有学术突破意义的重大科学挑战 ( ambitious, academically oriented scientific challenges )。

FutureHouse 成立于 2023 年 11 月,总部位于旧金山,主要由谷歌前总裁埃里克·施密特( Eric Schmidt )出资,目前团队约有 22 人。该组织分为两个核心团队:

科学团队( Science Team ):利用 AI 智能体进行开放式探索( open-ended exploration ),生成科学假设,并在自有的湿实验室中进行验证。

平台团队( Platform Team ):负责开发与扩展 AI 智能体( Develops and scales the AI agents ),将来自科研过程中的反馈整合进系统中( integrating feedback from the scientific process )。

FutureHouse将自动化科学发现构想为一个四层框架,每层功能相互支撑,并始终保留人类监督权( FutureHouse envisions automated scientific discovery as a four-layer framework, where each layer builds upon the last to create a comprehensive system with human oversight embedded )。

这四层分别是:

工具层( Tools )包含可用于预测或改造世界的模型与接口( models and interfaces that one can use to make predictions about the world or manipulate the world ),涵盖实验设备、计算工具( 如BLAST ),以及 AlphaFold3、Evo 等机器学习基础模型。

AI 助理层( AI Assistants ):由能够执行特定任务的模型组成,例如文献综述、临床试验数据库搜索等( literature reviews or searching clinical trial databases )。

AI 科学家层( AI Scientists ):这是系统的核心,包含能够自主管理整个科学工作流程的智能体( The centerpiece consists of autonomous agents capable of managing the entire scientific workflow and each layer )。不同于执行单一任务( perform isolated tasks )的 AI 助理,AI 科学家能够设计实验、生成并验证假设( AI Scientists oversee the entire process, from designing experiments to hypothesis testing ),并在每一个步骤之后根据新获取的信息调整研究方向。这种“代理式( agentic )”方法区别于传统的线性流程(a standard linear process),比如 RAG( 检索增强生成 )。

人类层( Humans ):最终目标( end-game )是让人类提出一个"探索任务"( Quest,即科研课题 ),由 AI 科学家自动完成研究流程,并产生可以在实验室中进一步验证的新颖假设( AI Scientist to autonomously execute the research flow, producing novel hypotheses that can be tested in the lab )。

四层 AI 科学家框架示意图。

AI 科学家工作流程示意图。

迄今为止,FutureHouse 已发布多款工具,其中包括 PaperQA:一个能够从科学文献中检索并汇总信息的系统。这是首批在多样化科学文献检索任务中实现超人类性能( super-human performance in diverse scientific literature search tasks )的 AI 智能体之一。FutureHouse 预计将为科学发现流程的其他环节发布更多智能体。

今天,我们邀请到了 FutureHouse 的首席执行官兼联合创始人 Sam Rodriques。Sam 拥有物理学和神经科学的学术背景,曾在麻省理工学院 Ed Boyden 的实验室接受训练。在创办 FutureHouse 之前,他曾短暂领导位于伦敦的弗朗西斯·克里克研究所( The Francis Crick Institute )的一家生物工程实验室,期间开发了多项创新技术,涵盖空间转录组学、大脑映射以及基因治疗( spatial transcriptomics, brain mapping, and gene therapy )等领域。

Zahra:是什么激发了你创办 FutureHouse 的想法?

Sam:在 Ed Boyden 的实验室攻读神经科学博士期间,我一直想弄清楚大脑是如何运作的。一个关键的体会是——即便我们已经掌握了理解大脑所需的全部知识,也没有任何一个人能够真正整理出几十年来零散分布在文献中的信息,或将数量庞大、标准不一的实验结果综合起来。我意识到,我们之所以难以取得重大突破,很大程度上是因为我们在整合信息和规划合适实验方面的能力受限( our ability to make big discoveries is limited by our ability to synthesise information and plan the right experiments )。因此,我开始思考,也许我能做的最有影响力的事情,不是亲自去做实验,而是构建一种计算系统,能够比人类更好地管理这种复杂性( the most impactful thing I could do is to create computational systems that could manage this complexity better than humans )。这个想法从那时起就一直萦绕在我心中,直到我在 Crick 研究所工作期间也未曾淡去。

范阳注:synthneuro.org, Ed Boyden 是麻省理工学院的 Y. Eva Tan 神经技术教授,他的实验室是前沿神经科学领域的研究组之一。

Zahra:有没有一个例子能说明,通过梳理几十年的文献资料,确实带来了有意义的结果?

Sam:一个直观的例子来自药物发现领域。有一个巧合性的案例,研究人员通过挖掘文献中被忽略的数据,发现了一种已有化合物的全新用途。虽然这只是一个例子,但它说明了一个更普遍的观点:系统性地挖掘海量科学文献中的信息,可以揭示隐藏的洞见与关联,有可能大幅加速科学发现与创新( systematically mining the vast troves of scientific literature can reveal hidden insights and connections, potentially accelerating discovery and innovation )。

范阳注:Matthew Kirshner @MattyKirsh

机器学习(ML)发现的药物很酷,但“老派”那种靠人力一步步摸索出来的偶然性药物发现故事往往更加精彩。

@TraceNeuro 今天宣布获得 1.01 亿美元融资,就是一个非常出色的“面包屑式”新型药物发现路径的例子:

1)从一个广为人知的蛋白质 TDP-43 开始,这种蛋白在 ALS(肌萎缩侧索硬化症)患者体内会神秘地聚集在大脑和脊髓中;

2)意识到这些聚集的 TDP-43 脱离了细胞核,导致它无法执行其正常功能:剪接中枢神经系统中的 mRNA;

3)列出一串由于缺乏 TDP-43 导致“异常剪接”的基因,并发现其中一个基因(UNC13A)也在 ALS 的基因研究中被多次提及;

4)进一步发现,UNC13A 基因中含有一段在健康人中通常会被 TDP-43 剪接掉的额外核苷酸序列;

5)找到一个特定的单核苷酸变异(single-letter change),当它未被剪接时,与 ALS 的疾病风险高度相关,说明 UNC13A 很可能是一个导致疾病的关键因素;

6)开发一个针对 UNC13A 的药物;

7)从一些生物技术领域最顶尖的投资者那里筹集到 1.01 亿美元融资,包括:@RACapitalMgmt @ThirdRockV @atlasventure @GVteam

Zahra:你是如何从最初的想法发展到获得埃里克·施密特( Eric Schmidt )的资助并创立 FutureHouse 的?

Sam:LLM( 大语言模型 )能力的快速涌现是一个重要转折点。当时我也在和 Adam Marblestone 一起完善 FRO( 聚焦研究组织 )的概念,这让我结识了 Andrew White 和埃里克·施密特( Eric Schmidt )。经过一年的时间,我与埃里克深入探讨,并将这一概念逐步完善成正式提案。建立信任关系至关重要——对于一个没有过往记录的全新构想,想要获得支持并不容易,所以那一年与埃里克的深度合作对最终融资起到了决定性作用。

Zahra:FutureHouse 将来会变成盈利机构吗?你设想的 FutureHouse 成熟状态是什么样的?

Sam: 现在说还太早。我们的主要目标是科学发现和最大化影响力( Our primary goal is scientific discovery and maximizing impact )。我们会采用一种能让尽可能多的人受益的模式( a model that ensures we can make discoveries available to as many people as possible )。这项研究需要开放,不能被私人机构所垄断( This research needs to be open and not withheld by private organizations )。为此,我们需要大量资源,包括构建基础设施的软件工程师——这在传统实验室体系下是难以实现的。

Zahra:你们如何选择研究项目?

Sam:项目筛选的核心标准是能否催生新的科学发现,这也将是我们衡量成功的关键指标(The guiding metric for choosing projects is whether they lead to new scientific discoveries, This is how we will measure our success )。我们没有固定流程,作为一个小型组织,我们的优势正是能灵活启动或终止项目。

我们的组织结构包括:

科学团队:专注于探索潜在方向,提出假设 ( A science team focused on exploring potential paths and generating hypotheses )

平台团队专注工具开发和系统扩展 ( A platform team responsible for developing the tools and scaling the systems )

我们会广泛探索可能的方向,然后优先推进最有前景的路径( We explore possible directions and then prioritize the most promising paths for further development )。

FutureHouse 组织结构

Zahra:您认为当前大语言模型的发展水平足以打造真正实用的 AI 科学家吗?现阶段的主要挑战是否已转向数据工程和基础设施建设( data engineering and infrastructure )?

Sam:当今模型的能力我称之为"B级智能"( B-level intelligence )——尤其在生物学等高度复杂的领域( especially in biology, where the complexity is immense ),它们还远不能媲美研究生的科研能力。但模型具有显著的规模优势( they excel in scale ):比如 PaperQA 能在几分钟内完成人类可能需要数月才能做完的文献分析。想象将这种速度应用于 10 万次实验的批量筛选,即使只有少量实验能产出有意义的结果,这种规模效应本身就能催生重大突破( the scale itself can drive breakthroughs )。

话虽如此,想让 AI 真正变革科学发现( for AI to truly revolutionize scientific discovery ),我们需要模型达到“A级智能”( A-level intelligence )。这不仅仅需要算法的改进,还需要强大的工具、更好的基础设施,以及与现有科研工作流程的无缝整合( robust tools, better infrastructure, and seamless integration with existing scientific workflows )。例如,模型需要能轻松访问补充材料和实验数据( access to supplemental materials and experimental data ),而当前系统在这方面还存在困难。即使是 o-1 模型,在这类任务上也尚未达到人类表现水平。我们的目标并不是模仿“人类”水平,而是超越人类的水平( We are also not aiming for “human” performance, but even more superior performance )。

我坚信这些挑战都在可攻克范围内,我预计在接下来的两年内,AI 系统将能够提出最具原创性的科学假说,并超越人类在这方面的能力。

Zahra:能否详细介绍一下你们近期发布的预印本论文 Lab-Bench,关于大语言模型科学推理能力( scientific reasoning capabilities )的研究?

范阳注:LAB-Bench: Measuring Capabilities of Language Models for Biology Research

https://arxiv.org/abs/2407.10362

Sam:Lab-Bench 构建了一个包含 2000 道题目的基准测试集,所有题目都经过人工验证,专门用于评估科学推理和任务执行能力。例如其中的FigQA 模块,就是针对科研图表批判性推理设计的评估组件。

我们在该基准上测试了多种前沿模型,比较了它们与人类以及随机猜测之间的表现。有趣的是,像 o-1 这样的模型虽然在初期测试时还不可用,但现在在诸如 ProtocolQA 这类任务中已经达到了人类水平。

在 Lab-Bench 评估集上前沿模型的表现:

结果显示的是各模型在选择回答的问题上的表现。请注意,o-1 模型未被包含在本次测试中。

Lab Bench 科学推理任务评估集

五个已实现的 Aviary 环境及语言决策过程(LDP)概览

Zahra是什么让 agentic(代理式)方法比 RAG( 检索增强生成 )工作流程在科学发现中更强大?

Sam:以 PaperQA 这个智能体为例。与传统 RAG 的线性流程( a linear workflow )不同——RAG只是按固定步骤检索论文、提取信息、生成答案——智能体扮演的是控制者角色( an agent takes on the role of a controller )。它能动态决策后续操作:检索文献时若发现某位作者很有价值,会主动追踪其研究;根据初步结果优化搜索策略;甚至能实时调用AlphaFold 等工具验证假设,再向人类提交最终建议。

我们的核心观点是:这种智能体模式天生更适合科研探索( this agentic approach is inherently more powerful for scientific discovery )。它不机械执行固定流程,而是通过"阅读论文→总结要点→定位关键信息→迭代优化搜索"的闭环学习,这种灵活适应性使其在复杂探索性任务中独具优势( flexibility and adaptability make agents uniquely suited for complex, exploratory tasks )。

Zahra:在这样的未来,人类科学家会扮演怎样的角色?

Sam: 未来 AI 负责基于数据分析提出假设和实验设计( AI will generate hypotheses and design experiments based on data analysis ),而人类科学家将更多地负责战略性决策:评估研究方案可行性、调配资源、把握研究方向( human scientists will shift to a more strategic oversight role - evaluating proposals, allocating resources, and guiding research direction )。这种人机分工结合了 AI 的规模化处理能力与人类的判断力,加速科学发现( leverages AI's ability to process vast amounts of information with humans' judgment and expertise to accelerate scientific discovery )。

Zahra:FutureHouse 当前最大的挑战是什么?

Sam: 实验瓶颈( experimental bottleneck )是首要难题:我们尚未构建出虚拟细胞或虚拟人体系统( lack a virtual cell or virtual human ),不得不依赖真实生物体和模式生物( This forces reliance on real biology and model organisms ),这既拖慢验证速度,又无法规避体外/体内实验的高成本,且结果不一定适用于人类( the high costs of in vitro and in vivo experiments or their limited representativeness of human outcomes )。

AI 科学助手( AI scientist agents )的目标之一,就是优化实验效率——为不同场景匹配最佳细胞系或模式生物,并设计错误率最低的实验方案。

Zahra:感谢分享!



原文链接:

https://decodingbio.substack.com/p/scaling-biology-003-sam-rodriques



谷歌 DeepMind:科学研究的工程化( Engineering for Science )

预测生物学(Predictive Biology):AI 驱动生物学从“还原论”到“涌现性”的新范式。

Arc Institute 与 Convergent Research 深度访谈:FROs、元科学运动、 ARPAs、快速资助。

“自动化科学” (Autonomous Science)的蓝图:AGI 遇见“实验室革命”

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

FutureHouse AI 科学家 人工智能 科学研究
相关文章