海外独角兽 前天 00:30
AI4Science 图谱,如何颠覆10年 x 20亿美金成本的药物研发模式
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章探讨了人工智能(AI)在加速科学发现,特别是在生物医药领域的应用。通过分析Biology Foundation Model、AI Scientist、AI-Native Therapeutics和AI-empowered solution等不同类型的企业,文章揭示了AI如何重塑科学研究的成本结构和创新速度。从蛋白质结构预测到自动化科研流程,再到AI驱动的创新疗法,AI正在推动药物研发的范式转变,加速新药的发现和开发。

🧬 **Biology Foundation Model的变革:** 以AlphaFold 3为代表的生物基础模型,能够精准预测蛋白质结构,并扩展到预测蛋白质与其他分子的相互作用,加速了对生命过程的理解和新药设计。

🤖 **自动化科研流程:** AI Scientist通过整合文献检索、实验设计、数据分析等环节,将科研流程自动化,降低了研发成本,提高了科研效率。Future House和Lila Sciences等公司正在构建AI科研平台。

💊 **AI驱动的创新疗法:** AI-native Therapeutics公司利用AI平台,贯穿药物发现到临床开发的全流程,自主研发创新疗法。Xaira Therapeutics、Generate Biomedicines等公司正在构建AI驱动的药物研发平台,加速新药的开发。

🔬 **AI优化关键环节:** 一些公司专注于利用AI优化传统研发流程中的关键环节,如数据服务和多组学靶点发现。Tahoe Therapeutics等公司通过提供大规模实验数据,降低了模型训练门槛,推动了下游个性化药物预测。

原创 拾象 2025-06-18 20:31 广东

AI 加速科学发现的寒武纪爆发

 

作者:Cage

上世纪 50 年代信息论和 DNA 双螺旋的发现,点亮了生命科学与数字互联网这两个最关键的科技树;今天 AI for Science 开始将这两股洪流汇聚并指数级加速。 大模型对生物系统这样复杂、非线性的系统有着前所未有的理解和生成能力,有望成为加速科学发现的关键引擎。

如果说上一代 AI 只是帮助科学家“更快地做旧事”,新一代 Foundation Model 则开始“做以前做不到的新事”。从 AlphaFold 3 、ESM3 到 Evo 2 等模型,他们把分子-细胞-系统的设计空间瞬间打开,自动化 AI Scientist 则把实验室变成可编排的软件流水线。这意味着十年、二十亿美元成本的药物研发流程,正被重新压缩与重构。

本文以「Tech/Bio × Generalist/Specialist」四象限为框架,梳理了以下几类玩家:

• Biology Foundation Model:深挖单点大模型极限,AlphaFold 3 级别的里程碑是个开始;

• AI Scientist:将多智能体编排成实验操作系统,让科研流程变成可复制的 AI Agent;

• AI-Native Therapeutics:基于全栈 AI 平台押注复杂疗法,争夺下一个百亿美元药物;

• AI-empowered solution:通过独特数据与算法解决行业痛点,带来立竿见影的效率红利。

💡 目录 💡

   01 Background

   02 研究框架

   03 Tech × Specialist:Biology foundation model 的范式变化

   04 Tech × Biologist:自动化科研(AI Scientist)重塑研发流程

   05 Bio x Generalist:AI-native Therapeutics AI 驱动创新疗法

   06 Bio x Specialist:AI 聚焦环节优化

   07 结语

01.

Background

上世纪 50 年代同时发生了两场革命:香农和图灵的信息论开始数字化革命,为互联网打下基础,为今天 AI 智能的快速提升提供了养料;与此同时,沃森和克里克发现了双螺旋结构,一个基于 0 和 1 数字编码和 DNA 遗传代码的信息时代由此诞生。两个学科的浪潮各自累积着奔腾的势能,直到 AI for Science 将他们交汇在一起,加速斜率将成倍放大。

过往的历史中,从炼金术士的炉火到现代的高通量实验,人类探索科学发现的方式始终离不开反复试错 Trial-and-Error。这让每一次科学发现都需要长时间、大金额的试错成本:今天一款创新药物从靶点发现到上市,平均要 10 年、20 亿美元 的实验投入。

计算平台的迭代正在改变这一切,Foundation Model 正在把高成本、慢速的实验变为可计算验证、迭代速度更快的闭环:在多尺度的分子、细胞、乃至系统层面,模型能筛选出最有潜力的分子结构,再把有限的实验资源精准投入到高价值验证。也就是说,Foundation Model + AI Agent disrupt 了人类专家 Trial-and-Error 的带宽和速度。

在这场范式迁移中,生命科学无疑是最前沿、也是资本与技术最密集的“主战场”。本文将聚焦 AI for Life Science 的最新进展:从蛋白质结构预测到全流程 AI Scientist 的研究型 Agent。我们将拆解技术路线、商业模式与未来机遇,探讨 AI 如何重塑科学发现的成本曲线与创新速度。

02.

研究框架

我们理解和研究 AI for Life Science 领域时,构建了这样一个 Mapping 象限:

• 横轴:Generalist vs. Specialist

这个维度评估的是 startup 在生物医药研发流程中的广度和深度。越靠近左侧,产品则就越偏单点聚焦;越靠近右侧,产品则越偏全流程的技术平台。横轴上的差异有些类似目前制药产业中 CXO 与药企之间的差异,但 AI 扩散可能会让产业链价值重新分配,因此我们特意避开直接用这个分类。

• 纵轴:Tech vs. Bio

第二个维度分析企业交付的产品是侧重于平台技术能力(Tech),还是直接解决生物/临床问题(Bio)。越靠近图的上方,越接近技术方案本身的交付,并不要求公司自己完整实现疗法;越往下方,则是需要完整开发一个药物/疗法。

按照以上的分类框架,我们觉得有以下公司和方向尤其值得关注,在这里先做简单的介绍,后面详细展开每一个领域的 Thesis:

03.

Tech × Specialist:Biology foundation model 的范式变化

AlphaFold 3 的里程碑与 Isomorphic Labs 独立融资

AF 3 的成功是 AI for science 的标志性事件。它解决了困扰生物学界长达50年的蛋白质三维结构预测难题,将过去需要数月甚至数年冷冻电镜实验才能解析的结构,缩短到计算机上的快速预测。蛋白质结构决定功能,AlphaFold的突破意味着我们能更快地理解生命过程、设计新药。

• AlphaFold 3 的进化: 由Google DeepMind及分拆出的Isomorphic Labs共同研发,不仅延续了对蛋白质结构的精准预测,更将能力扩展到预测蛋白质与DNA、RNA、小分子、离子等的复合物结构与相互作用。技术上,引入Diffusion Model简化了流程,减少了对多序列比对(MSA)的依赖,并拓宽了输入分子类型。其训练数据源自公开的PDB数据库,并辅以合成数据增强泛化能力。越来越多的生物医药的公司正在把 AF3 融入工作流中。

• Isomorphic Labs 的战略定位与进展: 由DeepMind分拆成立,CEO为诺贝尔奖得主、DeepMind创始人Demis Hassabis,团队核心成员来自原AlphaFold团队,技术实力顶尖。据报道团队已超70人,已与礼来(Eli Lilly)和诺华(Novartis)签署重大合作协议。与礼来的合作涉及4100万欧元预付款,总里程碑付款可达15.5亿欧元,专注于小分子药物发现;与诺华的合作涉及3400万欧元预付款,总额可达11亿欧元。这些合作验证了其技术的商业价值,并为其提供了真实的药物发现场景和数据反馈。Isomorphic Labs定位为技术平台提供方(Tech),专注于结构预测这一核心环节(Specialist)。

AlphaFold之外的模型路线:多模态与基因组

AlphaFold点燃了生物基础模型的热潮,后续模型沿着不同路径探索:

EvolutionaryScale 与 ESM3:通用生物多模态模型

1. 背景: 由前Meta AI蛋白质团队负责人Alex Rives创立,2024年6月推出ESM3模型并宣布获得Nvidia、Amazon等投资的1.42亿美元种子轮融资。

2. 技术路径: 旨在打造类似GPT的通用生物基础模型。ESM3基于双向Transformer,独特之处在于整合了序列、结构、功能三个模态的输入和输出。模型在编码阶段融合多模态信息,解码时可根据任意输入组合预测其他模态(如序列预测结构、结构预测功能等)。

3. 模型特点: 存在1.4B、7B、98B三种尺寸,展现明显Scaling Law(参数越大,性能越好)。通过RLHF(类指令微调)显著提升了在特定任务(如tertiary coordination)上的性能。

4. 产品与定位: 目前通过网页端提供模型服务(内测),目标是覆盖药物发现的更广泛任务(结构预测、药物生成、性质预测等)。尽管在单一结构预测任务上目前可能落后于专用模型,但其多任务、多模态能力代表了重要的发展方向。

 Chai Discovery 与 Chai-1:快速跟进与专注

1. 背景:在AlphaFold方向上复现速度极快,获得Thrive Capital和OpenAI领投的3000万美元种子轮融资,估值1.5亿美元。

2. 技术路径:采用与AlphaFold 3类似的Diffusion模型进行结构预测,专注于高精度预测蛋白质与复合物结构。

3. 定位:定位清晰,即成为结构预测领域的有力竞争者,提供精准、快速的平台技术服务(Tech x Specialist)。其快速获得顶级VC和战略投资方(OpenAI、Thrive)的支持,显示了市场对该方向的认可。

• ARC Institute 与 Evo2:解码基因组语言 virtual cell foundation model

1. 技术特点: 是一款基因组语言模型(40B参数),在超9万亿碱基序列上训练,拥有100万碱基的超长上下文窗口,能捕捉基因组范围内的长程依赖关系。

2. 核心能力: 1)预测变异功能:如在BRCA1基因突变良恶性判断上准确率超90%。2)设计生物序列:可设计新的基因元件、调控序列(如组织特异性启动子),甚至“人工生命代码”。

3. 战略意义:Evo2代表了序列层面的基础模型范式,与AlphaFold等结构层面的模型形成互补。它让我们能在遗传蓝图层面理解和干预生命,为基因疗法、合成生物学带来新工具。ARC Institute选择将其开源,加速了整个领域的进展。

生物基础模型正从单一任务(结构预测)走向多模态、通用化(ESM3)和深入基因组(Evo2)。这些模型共同构成了生物研究的计算基石,有望实现跨尺度(基因-蛋白-功能)的智能分析与设计。

04.

Tech × Biologist:

自动化科研(AI Scientist)重塑研发流程

传统生物科研面临周期长、成本高、结果难复现(年浪费$280亿)的困境。生物系统的极端复杂性使得人工试错效率低下。AI Scientist 旨在通过自动化研究流程来突破这些瓶颈。

AI Scientist 路线的核心理念是 LLM 的推理、规划、工具使用能力在科学研究领域放大,使其能够像科研助理甚至科学家一样工作,整合文献检索、实验设计、数据分析、机器人控制等环节。

在这一自动化科研架构中,各类基础模型将成为可以核心调用的 tool use:类似机器人中的 high-level 规划(AI scientist 框架)和 low-level 执行、调用工具(biology foundation model)的分工。

LLM 本身提供了强大的推理和知识整合能力,能从文献中学习科学知识、设计实验方案并优化决策流程。像 AlphaFold、Evo2 这样的专业基础模型则可以作为AI科研助手的“工具库”,在需要时被调用:例如代理在设计药物时调用AlphaFold预测配体-蛋白结合构型,在研究基因功能时调用Evo2预测突变效应,等等。基础模型成为自动化科研的基础设施,使得 AI agent 可以在无需人类介入的情况下完成许多认知和分析任务。

代表公司

• Future House

FutureHouse 由 Eric Schmidt 资助、沿用 FRO(Focused Research Organization)机制:不以商业化为近期目标,而是用长期耐心资本和开源方式,打造可自主提出问题、规划实验、迭代假设的 AI 科学家体系。

他们提出了其四层框架——工具层(基础模型、设备接口)→ AI 助手层(特定任务模型) → AI 科学家层(核心自主研究智能体) → 人类监督层(提出探索任务、监督)。基于这样的框架,他们目前发布了 4个 Agent:

Crow:“一句话读懂文献”

1. 定位:通用型检索 + 推理代理。

2. 能力:接入 PaperQA 派生管线,可在数秒内完成跨学科检索、证据链追溯和摘要,对 问题-答案 基准测试的准确率超越博士后平均水平。

Falcon:深度系统综述引擎

1. 定位:面向专家的“自动综述”助手。

2. 能力:连接 OpenTargets、PubChem 等十余个专业数据库,可执行基因-疾病-化合物的三向交叉检索,并生成结构化证据图谱。

Owl:“Has Anyone Done X?”

1. 定位:前沿监测与重复研究风险控制。

2. 能力:高召回式语义搜索,能追踪异构表述与冷门期刊,判断给定假设是否真正无人涉足;帮助团队避免重复造轮子、定位潜在合作方。

Phoenix:化学-实验规划师

1. 定位:ChemCrow 家族的合成设计体。

2. 能力:调用 RDKit、SafetyGPT 等工具,自动生成反应路线、试剂列表与实验 SOP,并对成本与安全性给出评分。未来将扩展到生物试剂自动订购与机器人实验室。

FutureHouse 将 Crow + Falcon + Owl + Phoenix(再加数据分析体 Finch)编排为多智能体系统 Robin。Robin 在 2.5 个月 内完成一次端到端科研循环,发现了治疗 干性年龄相关性黄斑变性(dAMD) 的全新药物方案:

1. 假设生成:Crow 审阅 1.7 万篇视网膜文献,提出“增强 RPE 细胞吞噬作用”假设;Falcon 列出 10 个 ROCK 抑制剂候选。

2. 首轮实验:Phoenix 设计体外筛选;Finch 解析数据,确认 Y-27632 提升 RPE 吞噬率并上调 ABCA1。

3. 机理-二次筛选:Robin 再次检索并锁定 ripasudil(原为日本获批青光眼药),体外验证优于首轮化合物;建议快速推进眼科适应症重定位。

4. 输出:Robin 自动撰写预印本、生成图表与方法学;人类仅执行湿实验。

AI Scientist有望将单个科学家的产出效率提升10-100倍。基础模型成为AI Agent调用的核心工具。这种模式将科研从劳动密集型转变为知识和算力密集型,极大加速创新迭代。

• Lila Sciences :

1. 定位: 构建“科学超级智能平台”,结合AI引擎和全自动化实验室,实现端到端的科学发现自动化。

2. 技术核心: 1)生成式AI科学引擎:能自主生成假设、设计实验、优化参数,并结合物理定律推理。2)自动化实验室基础设施:整合机器人、高通量设备,支持7x24无人化实验。

3. 披露成果: 他们的专注方向不止在生物领域,而是在材料、能源领域都有单独的管线和团队。已在发现新抗体/肽、设计催化剂(绿色氢气)、开发碳捕获材料等方面取得初步进展:

1)基因药物设计:产生优于市场的最优基因药物结构

2)新型治疗分子发现:发现和验证了数百种针对广泛治疗靶点的新型抗体、肽和结合物(耗时几个月)

3)绿色能源技术创新:开发出独特的非铂族金属作为绿色氢生产的催化剂,成本仅为当前商业催化剂的一小部分

4)碳捕获材料设计:为工业规模的碳捕获设计新材料,具有更好的容量、热稳定性和动力学结合

4. 商业模式: 偏向技术输出和合作赋能,计划与生物技术公司(包括Flagship系)合作,而非自行开发管线。定位为Tech x Generalist,提供广泛的科研自动化能力。

05.

Bio x Generalist:

AI-native Therapeutics AI 驱动创新疗法

这类公司是 AI-native 制药公司,它们的目标是构建一个以AI为核心、贯穿药物发现到临床开发全流程的整合平台,并利用这个平台自主研发和推进创新疗法管线。AI不仅仅是工具,而是其研发范式的基础和引擎。

这类公司的 upside case 是从零到一整体重构药物研发。它们先训练跨模态生物大模型,然后把模型输出结果做内部的高通量实验、乃至临床开发。有几个关键特点:

• 疗法类型更复杂:多聚焦大分子、RNA、细胞疗法等高级形态,监管和制造门槛都比小分子高。

• 产能矩阵式扩张:模型能同时孵化若干条管线,一条成功即可覆盖巨额研发投入。

• 自己own IP 和商业管线:通过将候选药物推向临床并最终实现商业化,或在临床后期/批准后寻求高价值的授权或并购。

• 尤其适合复杂/新型疗法: AI驱动的全流程方法可能特别适用于那些设计空间巨大、传统“试错法”难以驾驭的领域,例如:

1. 复杂生物药设计: 如设计具有特定结合位点、多特异性或条件性激活功能的抗体、蛋白质药物。

2. 细胞疗法: 如AI 优化细胞分化 protocol,我们之前 IC 讨论过的 Somite AI

3. 基因疗法: 如设计更高效、更特异的递送载体(如AAV衣壳),或利用AI(如Evo2)设计调控元件以实现精准表达。

• AI整合的广度与深度:

1. AI被系统性地应用于多个甚至所有关键阶段:从基于多维数据和生物学知识的靶点识别,到利用生成式AI从头设计或优化具有理想特性的小分子、抗体、肽类甚至更复杂的生物制剂,再到通过AI预测药物的药代动力学/药效学(PK/PD)特性、毒副作用(ADMET),乃至辅助设计临床试验方案、分析试验数据、预测患者响应等。

2. 这类公司通常致力于构建一个数据飞轮:AI预测指导实验设计,实验数据反馈优化AI模型,形成一个不断学习和进化的闭环系统。

尽管一旦突破,第一个成功上市产品就可能带来亿美元级峰值销售,这个赛 upside很高的同时又很risky:极高的风险和不确定性,研发周期长,所需资本投入巨大。不仅需要顶尖的AI能力,还需要强大的生物学、化学、临床开发能力,对跨学科团队的要求极高。平台能力的验证需要通过管线进展来体现,早期难以评估。

代表公司

Xaira Therapeutics

Xaira 成立于 2024 年,背后出资方包括 ARCH Venture Partners 和 Foresite Labs。公开资料显示,公司一次性募集了约 10 亿美元的启动资金,用来搭建一条把“数据生成—分子设计—早期临床”串在一起的完整研发链条。团队核心成员既有前基因泰克高管,也有蛋白质设计领域的学术领军人物 David Baker。

• 重点方向

1. 蛋白质生成式模型:在 RoseTTAFold、RFdiffusion 等开源路线基础上深度改造,用于重设计抗体、配体和新型蛋白递送载体。

2. 多模态数据工厂:自主建设高通量筛选和多组学测序产线,保证模型迭代的数据闭环。就在这周,他们发布了目前最大的公开可用的 Perturb-seq 数据集,名为 X-Atlas/Orion,为虚拟细胞研究提供支持,该数据集可用于 AI 模型训练,并能检测剂量依赖性遗传效应,从而增强药物发现的预测能力。

3. 端到端推进管线:首批项目聚焦自身免疫和肿瘤免疫调节,将快速推进到临床 I 期,验证“模型-实验-临床”一体化是否真能压缩研发周期。 整体来看,Xaira 押注的是“大投入纵向整合”模式:自己掌握数据、算法、实验和临床,减少传统跨公司协作中的摩擦成本。

Generate Biomedicines

Generate 由 Flagship Pioneering 在 2018 年孵化。公司把自己的方法称为“生成生物学”:利用大规模蛋白语言模型设计分子,再通过自动化实验完成验证和迭代。

• 重点方向

1. 多元蛋白疗法:从抗体到酶、细胞因子,再到更复杂的多特异蛋白,平台都尝试“按需生成”。

2. 合作与自研并行:已与安进、诺华签订潜在里程碑超过 10 亿美元的合作协议,同时保留十余条内部管线(免疫、罕见病、感染病)。

3. 高通量闭环:内部建有冷冻电镜、质谱、表型筛选流水线,用来把模型预测结果在短周期内转化成实验数据,反哺下一轮训练。 公开信息显示,公司累计融资超过 7 亿美元,并声称可把从命中到临床前验证的时间压缩到两年以内。Generate 想验证的核心假设是:在药物早期最烧钱、最耗时的阶段,用计算手段替代大量试错。

Somite AI

Somite 创立于 2024 年底,于 2025 年 5 月宣布完成 4700 万美元 A 轮融资,投资方包括 Khosla Ventures。公司聚焦“可编程细胞疗法”,目标是让干细胞定向分化变得可预测、可规模化。

• 重点方向

1. DeltaStem 基座模型:将数以百万计的单细胞转录组和时间序列表型数据作为训练集,预测细胞命运转变路径。

2. 微胶囊筛选技术:自研高通量培养系统,可同时观察上万个微型类器官,极大提高数据生成速度。

3. 再生医学应用:现阶段专注于 β 细胞(糖尿病)、软骨和肌肉修复,属于市场需求清晰且细胞疗法技术路线已较成熟的领域。 Somite 的商业逻辑是:通过更准确的分化预测,减少细胞疗法开发过程中的失败批次,从而降低 COGS,并把上市时间前移。

Moonwalk Bio

Moonwalk 于 2023 年末起步,种子 + A 轮总融资约 5700 万美元,创始团队包括 CRISPR 领域的张锋和前 Illumina CTO Alex Aravanis。公司专注“精准表观遗传编辑”。

• 重点方向

1. EpiRead:单细胞水平的表观基因组测序技术,能高分辨率绘制细胞在疾病状态下的染色质开放、甲基化等图谱。

2. EpiWrite:采用非切割的表观遗传编辑工具(如 dCas9-TET、CRISPR-off),在不改变 DNA 序列的情况下调控基因表达。

3. AI 靶点优选:利用深度学习模型从图谱中挖掘“可逆性”强、与疾病因果关联明确的修饰位点,优先推进动物实验。 Moonwalk 认为,相比基因敲除或基因替换,表观遗传层面的微调风险更低,而且适用于多基因复杂疾病。首批项目锁定代谢疾病和脂肪肝,若能取得动物模型验证数据,将为其平台带来早期可信度。

这四家公司共同代表了“Bio × Generalist”赛道的不同落地方向,但都试图用 AI 强化分子或细胞层面的设计能力,同时把实验、数据与模型打通,缩短研发时间并降低失败率。区别在于:

• Xaira 与 Generate 侧重蛋白质等分子层面,路径更贴近传统大分子药物;

• Somite 把目光投向细胞疗法,核心在于可控分化;

• Moonwalk 则尝试在表观遗传这一相对新的干预层面建立技术壁垒。

06.

Bio x Specialist:

AI 聚焦环节优化

最后这个象限的公司并非重建全流程,而是用 AI 深度优化传统研发的单一关键环节,用 AI 提升效率和成功率。他们的假设是把 AI 投入到最烧钱、最慢、失败率最高的节点,会比重新组装一条全栈研发线更快见效。因此我们看到有这样几个关键环节,会去用 AI 去大幅提效和进行优化:

数据服务

这类公司批量生成并开源稀缺实验数据,可以成为 AI4sci 领域的 Scale AI。他们的定位为上下游模型与药企提供“训练燃料”,自身不做管线,而充当生态底座。 核心数据 + 增值 API 或定制实验是他们常见的商业模式。这类数据集降低了模型训练门槛,同时推动下游个性化的药敏等属性预测。

代表公司:Tahoe Therapeutics 

Tahoe Therapeutics 与 Arc Institute 发布的单细胞扰动数据集,涵盖 1 亿细胞 / 6 万次化学-生物扰动,规模为公开同类数据的 50×。

Tahoe-100M是全球最大规模的单细胞扰动转录组(scRNA-seq)数据集,核心是记录不同药物扰动下,50种癌细胞系中每个细胞的转录组响应(即基因表达全景变化),覆盖21个物种、72种组织类型,并包含6万种药物-细胞相互作用记录。它通过Mosaic平台实现多细胞系混合培养、药物处理和高通量单细胞测序。

这种数据直接反映药物如何在细胞水平上重塑基因表达网络,揭示药物作用机制、细胞状态转变、耐药性、异质性等核心生物学问题。与传统bulk RNA-seq或蛋白组学相比,单细胞扰动数据能捕捉到细胞亚群特异的响应和罕见状态,极大丰富了AI模型的训练基础。这与提到 AI 公司主攻的蛋白质结构等方向有明显互补。

多组学靶点发现

比起结构预测那样的任务,靶点发现是更依赖生物专业能力的方向。也有公司在整合 DNA、蛋白、显微图像和临床表型等千万级多模态数据,训练跨尺度 Foundation Model,直接输出新靶点与作用机制假设。

过去 AI 模型基本无法在靶点发现上帮倒忙,而 Foundation model 的出现改变了这一点:

• 千亿 Token 多模态模型:覆盖 DNA->蛋白->细胞->组织四级信息;

• 跨尺度注意力:捕捉远程调控与细胞间信号,自动生成靶点-通路评分。

代表公司: Bioptimus

由 DeepMind 与 Owkin 科学家联合创办,累计融资 7600 万美元;获 NVIDIA 专属算力支持,未来的定位是“生物通用基础模型”供应商,目前客户用例基本集中在前期靶点相关的单点探索工作。

药物重定位(Drug Repurposing)

这类公司把已上市或临床搁浅的药物,与新的疾病通路、基因表达签名快速“拼图”,筛出可直接进入 II 期的适应症。这类方法有一些明显的优势:

• 成本优势:安全性数据现成;可跳过毒理与小规模 I 期。

 合作模式:常见“里程碑+下游版税”,前端资本负担轻。

• 目标人群多半是罕见病或儿童病,这些领域的临床安全容忍度高,对已知分子接受度也更高。

技术上,这类公司并非做完整的 foundation model,而是更像一个领先的专用模型

• 知识图谱 + 图神经网络:将“分子-靶点-表型”三层关系压缩到同一向量空间,迅速评估重定位机会。

• 基因表达逆转匹配(LINCS/L1000):寻找能够逆转病理表达谱的分子,优先用于罕见病或儿科疾病。

代表公司

 Healx:跑出稀有病重定位最快案例。2024 年 C 轮融资 4700 万美元,候选药 HLX-1502 已进入 NF-1 II 期,并获得 FDA 罕见病三重加速资格。

• Recursion:主营业务是做高通量细胞影像筛选,如今把 50 PB 的表型数据开放给大模型,重定位算是其中商业化比较快的切入点。依托 细胞影像数据,REC-994 正在脑血管病(CCM) II 期验证,展示了重定位与表型数据结合的规模效应。

临床试验加速 & 患者匹配

进入临床阶段值得优化效率的环节也很多,例如 50 % 以上的试验因招募延误而成本飙升。AI 可以 EHR、基因分型、影像等多模态数据,做入组筛查、分层与随访预测。LLM 能更好地理解病症关键词和实验室指标,再预测响应概率,做更好的患者匹配。过去也有不少公司用 NLP 和数字孪生(Digital Twin)技术替代部分对照组,直接减少样本量。

代表公司

• Paradigm:2023 年获 2.03 亿美元 A 轮,由 ARCH 与 General Catalyst 孵化。主攻“社区医院 + 远程分布式试验”

 Unlearn AI:2024 年 C 轮 5000 万美元,数字孪生技术获 FDA 探索性认可,可将招募期缩短 30–50 %,主力客户包括默沙东与拜耳。

这个领域的收费模式多为“每成功入组一个患者支付 X 美元”或与 CRO 按成功率分成,因此运营属性比相对标准化的 AI 产品高很多。

07.

结语

Foundation Model 与自动化 AI Scientist 正把科学探索推入“算力-数据-算法”驱动的指数级进步时代。 在四象限版图中:

 Tech × Specialist 在单点突破中构筑护城河,奠定了 AlphaFold 3 这类里程碑;

 Tech × Biologist 用多智能体把实验室编排成软件,将科研流程产品化;

 Bio × Generalist 借全栈平台押注新疗法,争夺下一个百亿美元级药物;

 Bio × Specialist 则用数据、算法修补关键瓶颈,为行业带来立竿见影的效率红利。

价值正在从传统 CRO 与药企的“手工试错”转移到掌握数据、模型飞轮与自动化实验室的 AI 原生公司手中。对创业者而言,这意味着必须、布局专有数据获取 + 模型闭环迭代 + 实验自动化;对投资人而言,这是一场关于实验计算化、跨学科人才密度与平台型网络效应的长期赛跑。谁能率先让 GPU 与模型源源不断地产出新分子、创造新疗法,谁就将在这场科学的寒武纪爆发中进化为新的物种。

 排版:范诗翎

延伸阅读

Granola:ChatGPT、Notion 都入场的 AI 纪要,能真正沉淀工作流吗?

巨头博弈下,Agent 的机会和价值究竟在哪里?

从 AI 招聘到数据标注,Mercor 能否打造下一个 Scale AI?

对谈 DeepSeek-Prover 核心作者辛华剑:Multi Agent 天然适合形式化数学 |Best Minds

押中 Figma、Scale AI 的 Thiel Fellowship, 今年下注哪些 AI 方向?

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

人工智能 科学发现 药物研发 生物技术 AI Scientist
相关文章