原创 郭瑞东 2025-07-05 15:41 上海
导语
2025年6月初,斯坦福大学黄柯鑫、Serena Zhang、王瀚宸、屈元昊、陆荧洲等研究人员联合Genentech、Arc Institute、加州大学旧金山分校及普林斯顿大学等机构,发布了通用生物医学AI智能体——Biomni。该智能体能够自主完成遗传学、基因组学、微生物学、药理学和临床医学等多领域的复杂研究任务,实现了AI在生物医学研究中从"辅助工具"向"自主研究者"的转变。Biomni通过整合分散的科研资源,有效解决了传统研究流程的碎片化问题,为跨学科、高通量的自主化科学发现提供了新的可能性。
郭瑞东丨作者
作为一名生命科学研究者,你是否时常因处理不完的实验数据感到烦恼?作为一个接受了基因检测的普通人,你该如何看懂基因检测报告,知道基因变异带来的影响?大模型的出现让你觉得可以咨询大模型,但又担心幻觉,如今斯坦福大学团队发布的生物医学领域的通用智能体Biomni,不仅能够帮助生物学研究者和相关领域的学生节省时间,提高科研效率,还能让生物医学领域的最新成果,更方便的进入普通人的生活。
Biomini系统地址:https://app.biomni.stanford.edu/
Biomni和通用智能体有何不同
Biomni和通用智能体有何不同
Deepseek等通用大模型,相比Biomni可以算是一个通才,而Biomni则是一个针对生物医学领域的智能体。它之所以厉害,是由于它包含了从基因编辑到蛋白质结构预测的150个专业工具,59个核心数据库(如PDB蛋白质结构、ClinVar临床变异等),这就相当于Biomni在完成通识教育后,又根据生物医学领域,进行了专业培训。
图1a)Biomni根据biorxiv上定义的25个生物医学相关子学科,经过专家审核定下的数据库和软件工具,同时该智能体的运行环境中,还包括了105个预装的生物医学领域的软件工具包,以及从分子克隆到显微镜操作的标准化实验流程。b)包含基因组,微生物,生化,病理,生物物理,分子生物学,药物等多个领域,c)Biomni的工作方式,包括搜索,推理,列出观察,执行代码并汇总等步骤
与传统大模型不同,Biomni不是输出一段文本,而是能像人类研究员一样动态生成Python/R代码来组合各种工具。Biomni的具体工作流程如下
使用网络搜索系统,识别最相关的工具、数据库和软件;
使用大模型的推理和规划将模糊的研究问题拆解为可执行步骤,制定出完成任务每一步的详细计划;
在执行阶段,每一步通过可执行代码表达,从而实现精确和灵活的操作;
在报告阶段,自动生成包含图表和讨论的“论文级”报告
由于是执行代码,Biomni的运行是动态调整,逐步迭代的,并能够展示出解答问题的全过程,避免幻觉的出现,这是其取决于之前的大模型工具的革命性之所在。
具体的表现如何,我们先来看论文中展示的几个案例,之后再讨论笔者实测的Biomni的几个例子。
Biomni的应用案例
Biomni的应用案例
第一个例子,是分析来自可穿戴设备记录的血糖检测数据,假设你拿到来自30人的连续血糖和体温监测数据,以及吃饭的时间点的几百份原始excel数据。只需要直接丢给Biomni,Biomni自动完成了数据清洗,之后探索数据中的规律发现了人类可能忽略的模式:餐后体温平均上升2.19°C,个体之间差异存在差异。最终数据分析的结果,以图2c的图表形式展示出来。而这一切的过程,都有着可复现的代码,这相当于一个完全体的数据分析师任你差遣。
第二个例子,是让biomni进行生物领域更复杂的数据分析,丢给Biomni一组骨骼发育的单细胞转录组snRNA加单核ATAC数据,Biomni用5小时完成了人类需要数周的分析:它不仅能重现了已知的骨骼发育调控网络(如RUNX2基因的作用),还发现了三个从未被报道的“幕后导演”——AUTS2、ZFHX3和PBX1转录因子在软骨细胞和成骨细胞中异常活跃(图3h)。这就是传统的大模型,甚至是像Manus这样的智能体都无法完成的工作,因为这些智能体无法调用分析专业数据所需的python包,而针对生物医学开发的通用智能体,可以直接运行相关的数据分析代码,这体现了Biomni相比之前工具革命性的优势。
第三个例子更加具有挑战性,Biomni被要求针对一段给定的碱基序列,设计的CRISPR敲除方案,流程如图4所示,Biomni设计的方案通过了专家盲审,更在真实实验中一次成功——设计的引物100%准确,克隆效率超越人类实习生,与一位拥有五年相关领域经验的斯坦福博士后的水平相当。这打破了“AI只会纸上谈兵”的刻板印象。
Biomni亲身体验展示
Biomni亲身体验展示
除了论文中提到的几个例子,笔者也亲身体验了Biomni,接下来展示几个案例。
首先是对基因测序的结果进行解读。无论是遗传病还是癌症的靶向药检测,基因检测已经越来越大众熟悉。但普通人面对检测结果,却缺少解读能力,如果询问大模型,会担心其出现幻觉。而Biomni可以在拿到基因检测结果后,给出个人用药和可能的遗传病风险信息,根据证据等级和严重程度,汇总成markdown形式的报告展示。除了对基因变异的解读,Biomni还会给出临床管理建议,替代药物选择及进一步的检测项目建议。有了Biomni,普通人也可以获得专业的基因检测结果解读了,这相当于替代了专业的遗传咨询师的工作。
对于生物医学领域的学生,阅读文献是必不可少的,而Biomni不止能像传统的大模型那样帮你总结文献。丢给Biomni一篇使用空间组学研究乳腺癌的论文,Biomni会将论文拆解为几部分,分别通过代码输入了新编写的程序,在通过执行程序得到对文中每一部分对总结,之后模型会执行代码,规划下一步要进行的动作,最终生成的总结,能够确保忠实于原文。更超预期的是,Biomni虽然由于无法处理图片,没有像素级的复现出论文中研究图表对应的可视化展示,但其根据论文中的描述,生成的代码及其绘制的图,的确包含了研究图表中对应的发现,如图6所示。这无疑方便了相关领域的学生复现关键论文,通过运行大模型生成的代码,切身体验论文对应的研究过程,从而加深理解。
在接下来的提问中,笔者还尝试让Biomni根据给出的文献,设计类似项目的实验计划,并推荐该领域的相关文献,Biomni在总结了对应论文实验设计上的关键点,并进行了谷歌搜索后,Biomni给出了如果我想照葫芦画瓢,用类似的方法研究前列腺癌,需要做什么样的实验,多么大的样本量,需要关注那些生物标志物,如何对发现进行验证等信息,并通过甘特图给出了项目每一阶段的预期目标。不止如此,Biomni还给出了空间转录组实验设计最佳实践指南这样一份具有一般性的指导文件,这就远远超过了一般通用大模型工具,不仅会搜索,还会生成绘制类似可视化图所需的代码,可借鉴的实验设计等,这无疑将方便相关领域研究者的学习与实践。
图6 Biomni根据论文描述,编写代码,运行后绘制的图
Biomni论文中给出了一个让Biomni进行分子生物学专业数据分析的例子,而笔者则试了试论文中没有提及的一类数据分析任务,即通过全基因组关联分析的结果,使用孟德尔随机化找到具有因果关系的环境暴露因素。这里选取了来自GWAS catelog中关于帕金森的一项研究,将未经人工清洗的数据丢给Biomni,也没有给出明确的实验方案。Biomni自主完成了数据清洗,并按照孟德尔随机的标准方案进行了数据分析,其中的每一步都清晰可见,分析结果的可视化,也和主流论文中的图表类似,如图7所示,虽然笔者给出的数据没有得到具有显著临床意义的数据,但这也展示了Biomni进行完整生物医学实验的能力。这说明了Biomni的通用性,能够具有在广泛的生物医学相关数据分析任务泛化。
图7 Biomni根据提供的数据,进行孟德尔随机发分析后,得到的结果可视化
除了学术界,Biomni也可以帮助产业界规划科研转换,例如让Biomni涉及一整套能够减少肺癌发病率的早筛方案。Biomni先搜索了相关方案,给出了结合基因组,转录组,蛋白组和代谢组的整合方案。之后还给出了检测报告生成的代码架构,报告模版和可视化展示,并对方案对临床价值进行了评估,而这一切都只花了十几分钟就能完成。
未来展望
未来展望
尽管表现惊艳,论文作者对Biomni保持了清醒认知,指出Biomni当前偏重分子生物学和基因组学,对神经科学、生态学等领域覆盖不足,在需要颠覆性思维的原创研究(如全新实验方法设计)上仍落后人类,同时Biomni的设计导致其过于依赖最新文献,可能忽略早期重要但“过时”的方法。
未来的方向,可以整合显微镜图像、实验视频等非文本数据,训练多模态模型,并通过构建世界模型,让智能体得以通过强化学习从实验失败中自主改进,更进一步的目标是开发“AI-人类”混合工作流,而非完全替代人类研究者。
Biomni的出现,代表的不仅是技术突破,更可能引发科研范式的根本变革。试想:博士生可以从繁琐的数据分析中解放,专注创造性思考。偏远地区医院也能获得顶级基因诊断能力,让医疗资源更加平等,而科研的泛式从“假设→实验→发表”的线性流程变为并行探索网络,这些变化正如AlphaFold颠覆结构生物学,Biomni或许正开启一个“AI-人类共生”的新科研时代。它提醒我们:科学的未来不是机器取代人类,而是懂得使用AI的科学家取代不懂使用的同行。在这个意义上,每个研究者都面临选择——是成为AI的导师,还是沦为它的助手?
AI驱动的计算医学前沿研讨会
生命科学与医学领域正经历着深刻的智能革命。大语言模型与多智能体技术快速发展,正在推动形成计算医学(Computational Medicine)新范式,为精准医疗、疾病诊断和健康管理开辟全新路径。AI驱动的计算医学在自主探索、跨尺度数据融合、个体建模与数字孪生等方面快速发展,然而跨学科合作与方法论整合仍是重要挑战。
为此,DAMO开发者矩阵(由阿里巴巴达摩院和中国互联网协会联合发起)与集智俱乐部共同主办“AI驱动的计算医学前沿:从科学发现到数字孪生”系列研讨会,邀请多位国内外前沿学者与业界专家分享交流。系列研讨会将系统梳理计算医学与AI交叉领域的最新进展,自2025年7月6日(周日)开始,共5大议题分享与讨论。欢迎相关研究、应用领域的朋友报名参加,共同推动生命科学与医疗健康的智能未来!
本活动免费报名,实行审核入群制,请填写信息后入群参与交流并获得每期活动信息。
详情请见:AI驱动的计算医学前沿研讨会开启报名:从科学发现到数字孪生
推荐阅读
3.Barabasi 组新作:非编码 RNA 提高网络医学预测能力
6. 探索者计划 | 集智俱乐部2025内容团队招募(全职&兼职)
点击“阅读原文”,报名系列研讨会