原创 十三维 2025-07-02 17:05 上海
导语
人类知识正以前所未有的速度爆炸,科学智能、尤其是AI科学家的发展正在迅速改变人类科研范式和版图。在这场科学研究革命的前夜,一群来自多伦多大学、清华大学、佐治亚理工学院等顶尖机构的研究者们,发表了一篇富有远见的论文《Scaling Laws in Scientific Discovery with AI and Robot Scientists》,指出一个由人工智能(AI)和具身机器人(Embodied robotics)驱动的“自主通用科学家”(Autonomous Generalist Scientist,AGS),将有望打破科学的学科界限,自动化整个科研生命周期,从文献海洋中披沙拣金,到大胆提出假说,再到设计并执行复杂的虚拟与物理实验,乃至最终撰写具有颠覆性成果的学术论文。这预示着,当前人类科学发现的“规模法则”(Scaling Laws),或许将因这些不知疲倦、能力超群的Al自主系统的加入而被彻底改写。
十三维丨作者
论文题目:Scaling Laws in Scientific Discovery with AI and Robot Scientists
一、科学研究的演变:从人类到自主系统
一、科学研究的演变:从人类到自主系统
人类文明史上,科技发展一直是推动社会进步的核心力量,深化我们对自然世界的理解,推动技术创新,解决复杂问题,改善社会福祉。然而,传统研究方法存在固有的复杂性和方法学局限性,常常阻碍科学快速进步。
例如,一位科学家穷其一生可能也只能深入钻研某些细分领域。而解决当今世界如气候变化、疾病防治等复杂问题,往往需要跨越多个学科的知识融合。另一方面,基于大语言模型的AI科学家则在海量数据上训练,掌握了跨学科生成和理解文本、多模态信息的能力,在信息综合、思想产生、编码乃至学术写作等方面已展现出超越人类的惊人潜力。
尽管如此,当前人工智能在科学研究中的应用主要集中于数据分析、模型构建、文献综述等虚拟空间的任务。在诸如药物设计、化合物筛选等领域,AI已经成为强有力的辅助工具。然而,科学研究的全流程不仅包括理论推演和数据处理,还涉及实验设计、设备操作、样本处理等物理世界的复杂环节。如何让AI系统进一步参与到这些实际操作中,成为推动科学创新的新课题。为此,本文研究团队提出了“自主通用科学家”(AGS)的设想。AGS旨在打造一个能够跨学科自主管理科学研究全过程、兼具虚拟与物理操作能力的系统,提出了科学研究演进的三个阶段:
人类科学家阶段(Human):完全依靠人类研究者进行科学发现;
AI与机器人协作阶段(Co-scientists):人类与AI、机器人共同开展研究;
自主通用科学家阶段(AGS):智能系统完全自主地进行科学研究。
这种演变不仅仅是研究方式的改变,更是一场真正的范式转移,AGS可能催生科学发现的新规模法则 (New Scaling Laws)。传统上,科学知识的增长在一定程度上与投入的人力(科学家数量)和时间相关,AI作为合作科学家(Co-scientists)的出现,已经开始提升这一增长曲线的斜率。而AGS,凭借其自主性、通用性和潜在的并行工作能力,有望将科学发现的效率提升到前所未有的水平,甚至可能呈现指数级显著陡峭的曲线增长态势,如图1所示。就像计算机如何彻底改变了数学和计算问题的解决方式,自主科学家系统可能会重新定义我们发现和理解世界的方式。
研究者在讨论AGS系统的潜力时指出:“具身机器人对极端环境的适应性,以及科学知识积累的飞轮效应,将持续突破物理和知识的边界”,如图2所示。
根据论文,AGS系统可能通过以下几个关键机制,自我强化的知识加速积累,改变科学发现的扩展规律:
全周期自主运行能力:AGS能够在没有人类干预的情况下管理整个研究周期,从文献分析到实验执行再到结果解释,同时能够在计算环境和物理实验室之间无缝切换,将理论建模直接转化为精确的实验操作。
跨学科知识整合:能够融合多个领域的专业知识,突破传统学科边界,发现跨领域的创新机会和意外联系,实现系统性的知识重组和交叉创新。
持续学习与快速迭代:通过内部反思机制、外部反馈循环和海量数据学习,不断优化研究方法和能力,实现“快速失败、快速学习”的高效研究模式和螺旋式能力提升。
规模化协同与知识网络效应:多个AGS可以大规模并行处理、全天候不间断运行,同时所有AGS产生的知识、经验和方法论能够被整个网络瞬间共享和复用,形成集体智慧的正反馈循环。
在图3显示了世界银行历史数据的趋势,并预测了未来随着AI和机器人科学家加入研究队伍,科学出版物数量将会出现显著不同的增长模式,即从人类主导到AGS主导的科学研究中,知识生成率的变化趋势,将会超过显著超过现有人类科研增长水平。
可以预见,由上面这些机制共同作用,未来可能创造一种科学知识增长的复合效应,这种变革的最终结果将是重新定义人类文明探索未知世界的能力边界,形成所谓科学发现的“新规模法则”,开启一个真正的“科学发现摩尔定律”时代。
二、自主通用科学家:架构与能力
二、自主通用科学家:架构与能力
成熟的AGS将不仅仅是一个单一的系统,我们可以把它想象成一位科研界的“多面手”,或者一个高度协同的“科研梦之队”,其整合了AI智能体和实体机器人的综合框架,具备在虚拟和物理环境中通用的操作能力,核心由五大功能模块构成,并通过内部互动和反思机制不断进化,从而构成了完整的研究生命周期,如图4所示:
文献综述(Literature Review)模块:不仅仅是关键词搜索,而是能够像人类研究员一样,自主进行全面的研究分析,模拟人类与学术数据库和期刊平台的交互,导航各种数字环境、甚至克服订阅障碍以搜索、访问和管理相关文献。由此做出一个领域从开山鼻祖到最新进展的所有关键文献综述,并指出知识的空白和矛盾之处。如表1所示,论文中特别强调了操作系统级智能体(OS agents)的重要性,这种“直接与网站和应用程序交互”、模拟人类在电脑上操作的能力,一部分已在通用智能体,如 Manus 在虚拟环境中使用“Browser use” 和 “Computer use”等交互方式实现。
提案生成(Proposal Generation)模块:制定全面的研究提案,包括精确的问题陈述、明确的目标和创新的假设,发展详细的方法框架和实验协议。在充分“消化”文献之后,AGS会着手撰写一份全面的研究计划书。 它会明确提出问题、设定清晰的目标,并形成具有前瞻性的创新假说。 更重要的是,它会设计详细的方法论框架和实验方案,兼顾虚拟模拟和物理实施的可行性,为后续研究铺设清晰的路线图。 正如论文所述,“大型语言模型产生的想法在创新性上持续表现出高于人类专家的水平。” AGS将这种能力系统化,通过自动化的差距分析、严谨的问题陈述、可测试的假说构建、以及周密的方法设计,确保研究提案的质量。
实验(Experimentation)模块:协调研究过程的实验阶段,包括精确规划、资源优化和在虚拟与物理环境中的试验执行。系统将通过持续分析实时结果和反馈,动态优化实验设计。这是AGS真正展现其“手脑并用”能力的舞台。 借助先进的机器人技术和AI算法,AGS可以执行精密的物理操作,收集经验数据,并进行虚拟实验。 它还能根据实时结果和反馈动态调整实验设计。 论文特别地指出,当前AI在虚拟实验中表现出色,但在物理实验自动化方面仍有巨大鸿沟。 AGS致力于弥合这一差距,通过整合具身AI的机器人系统,使其能够在化学、材料科学等领域完成从分子预测到物理合成与表征的全流程。
手稿准备(Manuscript Preparation)模块:实验完成后,AGS会将研究成果综合成一篇符合发表标准的学术手稿。 它会进行全面的数据分析,解读结果,并阐述实质性的结论。 该系统能按照标准的学术规范构建文档——包括方法细节、结果展示和理论讨论——同时进行内部质量评估,并能与模拟的同行评审机制互动,确保学术严谨性。 论文提到,AI系统可以辅助起草手稿的各个部分,从引言到讨论,甚至处理复杂的数学公式和文献引用。
反思与反馈(Reflection and Feedback)模块:这个模块将建立功能组件之间的通信渠道,以便进行实时调整,同时整合来自人类合作者和模拟同行评估的外部输入。这赋予了AGS持续学习和进化的能力。 通过系统分析这些反馈,AGS能够优化假说、方法论和实验途径,确保研究对新兴发展保持敏感,并最大化科学产出的最终影响和质量。
而要理解AGS如何实现如此复杂的自主科研能力,就必须深入其“大脑”,这是其认知与决策的核心(图5)。AGS的大脑框架分为外循环和内循环两部:
外循环:负责人与环境的交互,通过感知(Perception)从环境(Environment,包括人类交互)获取信息,经过大语言模型大脑(LFMs Brain)处理后,通过行动(Action)影响环境,行动方式包括使用/创造工具(Use/create tools),利用具身机器人(Embodied Robot)在物理(Physical)环境中操作,或在虚拟(Virtual)环境中进行。大语言模型大脑内部包含记忆(Memory)、思考(Thinking)、知识(Knowledge)和学习(Learning)等认知过程。
内循环:是一个自持续的思考循环(Self continuous thinking loop),它接收内部/外部信息(Internal/External infos,如时间、硬件、计算资源、环境等),进行自我反思(Self-reflect)和基于思考的奖励(Reward in Thought,即自我奖励 Self reward),然后进入规划/推理(Planning/Reasoning)阶段(采用思维链 Chain of Thought,思维树 Tree of Thought,蒙特卡洛树搜索 MCTS,内部推理 Internal reasoning等方法),最终做出决策(Decision Making),完成认知(Cognition)过程。
三、自动科学发现的级别与演化:
从环境交互到自主先锋
三、自动科学发现的级别与演化:
从环境交互到自主先锋
研究团队提出了科学发现自动化的分类框架,将AGS划分为不同级别,基于其自主程度、与模拟和现实环境的交互以及整体研究能力(表2):
等级0:无AI(No AI):纯粹的人类科学家,使用传统的、非AI驱动的工具和方法。如化学中的光谱设备和分析平台,或公共卫生中的统计软件和流行病学建模工具。
等级1:工具辅助(Tool-Assisted):人类仍是主导,AI 作为简单工具出现,辅助研究者完成特定、狭窄的任务,例如ChatGPT提供文本辅助,基础机器学习模型处理数据。
等级2:智能助手(Intelligent Assistant):AI系统升级为复杂的研究助手,能在人类监督下自主进行网络信息搜集、虚拟模拟和整合不同学科的见解,例如OpenDevin、DeepResearch 等系统。
等级3:协作伙伴(Collaborative Partner):AI系统进化为自主的科研合作伙伴,能够无缝整合虚拟和物理环境的互动。 配备先进机器人后,它们可以在生物学、工程学等领域进行精确的物理操作,但仍与人类科学家合作。 这好比一个经验丰富的博士后,可以独立承担一部分复杂的跨学科任务。
等级4:自主研究员(Autonomous Researcher):AI在此阶段以高度独立的方式运作,仅需极少的人类指导。 它们能进行高级研究,自主检索信息,综合多领域知识,甚至产生全新的见解并提出创新方案。 “通用人工智能机器人”(Artificial General Intelligence Robots,AGIR)是这一级别的代表。
等级5:先锋(Pioneer):这是AGS的终极形态——“人工超级智能机器人”(Artificial SuperIntelligence Robots,ASIR)。 它们完全自主,超越人类的科研能力,能够在所有环境中完全独立地操作,不仅综合跨学科知识,还能创新并形成全新的科学原理,产生前所未有的科学发现,制定全新的科学原则,引领科学前沿。
由上所述,从等级3开始,AGS系统的关键创新在于将智能AI与先进机器人技术相结合,创建能够管理复杂研究流程并在物理世界中执行实验的完整系统。正如研究者所说:“将LLM(大型语言模型)与机器人系统整合,如 ROS-LLM平台所展示的,能够在实验过程中进行结构化推理和明智决策,优化资源利用和实验结果进行研究”。
在虚拟环境中,AI智能体能够执行算法,进行复杂的数据分析,处理逻辑和文本信息,设计和执行复杂的模拟,为后续物理实验提供宝贵的见解和预测。而在物理环境中,具有“世界模型”(world models)的“具身AI”(Embodied AI)和“通用机器人”(General-Purpose Robotics),则负责执行复杂的物理操作,具备精确性和适应性。这些通用机器人能够执行各种实验协议,处理材料,操作设备,并根据感官反馈进行实时调整。
在图6中,我们可以看到从2020年左右开始,科研自动化水平的演进。从人类使用工具(虚拟、物理),到基于聊天的知识提供者(如ChatGPT),再到能在虚拟环境中自主工作的智能体(如Devin,Autogen),然后是能在物理和虚拟环境中均自主工作的机器人(如Co-scientist,具备高级操作能力),预计到203X年左右达到人类,即多数硕士、博士、研究科学家的水平,成为通用具身智能机器人,覆盖无限科学领域,最终迈向超越人类科学家水平,引领科学研究发展走向。
在图7中,则追溯了机器人科学家从2004年的“机器人科学家”概念,到2004年的Robot Scientist,2009年的 Adam(RD.K),2019年的PaperRobot,2020年的移动机器人化学家,2023年的Coscientist,2024年的研究智能体(如Nova,ORGANA)、AI科学家(MIT SciAgents),到2025年谷歌的AI合作科学家、AMD的Agent Lab,并展望2030+年实现AGS。图中不同颜色的条带代表了不同类型的研究:特定领域的机器人与机器学习研究、特定领域的AI与机器人研究、特定领域的AI智能体研究,以及最终的通用多领域具身AI机器人研究。
AGS概念最令人兴奋的可能性之一是能够超越人类身体极限,将科学探索扩展到人类无法或难以进入的极端环境。研究团队设想机器人科学家能够在太空探索、深海研究和微观尺度等领域开展独立科学探究。
想象机器人科学家在月球和火星上建立研究基地,在太阳系内甚至更远处进行科学探索。同样,在地球深海,这些系统可以在巨大压力、永久黑暗和远离人类支持的环境中工作,探索热液喷口、研究独特生态系统并监测地质活动。
此外,机器人科学家的能力还延伸到微观和纳米尺度,可以在先进材料科学、人体内靶向药物递送或微观污染物环境监测等领域开展独立科学探究。
正如研究者指出:“随着技术的持续进步,通过超越人类物理限制的系统探索和发现,这些系统将会显著增强我们对宇宙、地球以及物质基本构建块的理解。”
此外,研究团队还提出了一个有趣的问题:AGS 如何管理和传播它们的研究成果?传统学术系统主要为人类研究者设计,可能难以处理自主系统生成的出版物和提案。为此,研究者效仿人类的预印本论文平台 Arxiv,提出建立一个名为 aiXiv 的中介平台,如图8所示,作为自主系统生成研究的开放预印本服务器,实施专门针对AI驱动发现特点的分层审查流程。这种方法旨在确保AI生成的研究遵循透明度和可信度原则,同时解决与非人类作者相关的科学交流伦理考虑。
AGS概念令人振奋,但实现完全自主的科学研究系统仍面临重大挑战,例如感知与操作能力、自主性与决策能力:适应性与泛化能力、物理安全性、人类水平交互、伦理与法律问题等等。不过,随着时间发展,相关难题正在逐一攻克中。
就在前不久, DeepMind 已经发布了 AlphaEvolve 系统,已经实现了自主优化算法、训练自身,从而实现能力进化,不仅改进了计算效率,还在多个数学和计算机科学难题上取得突破性进展。例如,在矩阵乘法优化研究中,打破了 56 年未能突破的计算效率,将 4×4 复值矩阵运算次数从49 降至48。此外,它还优化了 Google 数据中心的计算资源调度,提高了 AI 训练效率,节约了0.7%的算力资源,它还改进Gemini的大规模矩阵运算算法,最终使整体训练时间缩短了1%。
集智俱乐部关于AlphaEvolve的报道:Nature:DeepMind发布重磅通用科学人工智能体
AlphaEvolve 系统本质是在模拟生物进化的过程来优化程序生成(图9)。其中提示采样器(prompt sampler)就像是“环境选择压力”,它根据当前最优秀的程序来构造新的提示;语言模型则充当“基因变异”的角色,基于这些提示产生新的程序变体;评估器相当于“自然选择”机制,判断哪些程序表现更好;而程序数据库就是“基因库”,保存着经过筛选的优秀程序,并通过进化算法决定哪些“基因”(程序)应该被传递到下一代。
由此可见,AlphaEvolve 的出现已经向AGS迈出了重要一步,它已经相当于达到了缺乏物理和实验操作的AGS大约3-4级水平。
总之,AGS代表了科学研究彻底转变的重要一步。就像显微镜和望远镜如何扩展了我们观察微观和宏观世界的能力,这些自主系统可能会扩展我们进行科学探索的范围和速度。这不仅是科学工具的演变,更是科学本身的转变——将科学探索的边界推向前所未有的高度,开创更高效、更具创新性的科学研究方法,超越当前限制,最终加速整个人类文明的进步。
本文为科普中国创作培育计划作品
作者:十三维
审核:张江 北京师范大学系统科学学院教授
出品:中国科协科普部
监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司
AI驱动的计算医学前沿研讨会
生命科学与医学领域正经历着深刻的智能革命。大语言模型与多智能体技术快速发展,正在推动形成计算医学(Computational Medicine)新范式,为精准医疗、疾病诊断和健康管理开辟全新路径。AI驱动的计算医学在自主探索、跨尺度数据融合、个体建模与数字孪生等方面快速发展,然而跨学科合作与方法论整合仍是重要挑战。
为此,DAMO开发者矩阵(由阿里巴巴达摩院和中国互联网协会联合发起)与集智俱乐部共同主办“AI驱动的计算医学前沿:从科学发现到数字孪生”系列研讨会,邀请多位国内外前沿学者与业界专家分享交流。系列研讨会将系统梳理计算医学与AI交叉领域的最新进展,自2025年7月6日(周日)开始,共5大议题分享与讨论。欢迎相关研究、应用领域的朋友报名参加,共同推动生命科学与医疗健康的智能未来!
本活动免费报名,实行审核入群制,请填写信息后入群参与交流并获得每期活动信息。
详情请见:AI驱动的计算医学前沿研讨会开启报名:从科学发现到数字孪生
具身智能读书会
集智俱乐部联合上海交通大学助理教授李永露、银河通用机器人合伙人史雪松、南京大学LAMDA组博士生陈雄辉、香港大学在读博士生穆尧,共同发起首季「具身智能」读书会。读书会计划采用“自下而上”的层级结构,探讨四个核心模块:硬件系统(机器人本体设计),数据、仿真环境与Benchmark,机器人学习,具体场景任务。希望通过重点讨论经典、前沿的重要文献,帮助大家更好地学习机器人与具身智能技术前沿技术,为相关领域的研究和应用提供洞见。读书会已完结,现在报名可加入社群并解锁回放视频权限。
推荐阅读
2.你的公司有没有偏离规模法则?中美对比、企业评估与生长预测
6. 探索者计划 | 集智俱乐部2025内容团队招募(全职&兼职)
点击“阅读原文”,报名系列研讨会