掘金 人工智能 18小时前
手术台上的AlphaGo:约翰霍普金斯大学发布自主手术机器人
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

约翰霍普金斯大学(JHU)近期发布了SRT-H框架,成功让手术机器人在无人类直接操控下,100%自主完成了离体猪胆囊切除术。该技术不再依赖外部标记,而是通过视觉和AI模型理解手术场景并自主判断,标志着手术机器人从“自动化”迈向“自主化”的关键一步。SRT-H采用分层式框架,包含一个高层“手术指挥官”(负责理解场景、生成指令和纠错)和一个低层“精英执行官”(负责将指令转化为精确动作)。尽管在离体实验中表现优异,但SRT-H仍面临理想化环境、手术速度和泛化能力等挑战,预示着手术机器人领域将从“增强医生”模式向“赋能系统”模式转变,对未来医疗产生深远影响。

🌟 SRT-H框架实现手术机器人自主化,在离体猪胆囊切除术中达到100%成功率,标志着手术机器人从依赖预设路径和标记的“自动化”阶段,迈向能够通过视觉自主理解场景并做出判断的“自主化”新纪元。这使得机器人能够独立完成多步骤的外科手术子任务,无需人类中途干预。

🧠 SRT-H采用精巧的分层式(Hierarchical)框架,模仿人类外科专家的“先思考,后动手”模式。高层“手术指挥官”利用视觉模型分析内窥镜视频,通过自然语言生成任务指令并进行错误纠正,提高了系统的可解释性和鲁棒性;低层“精英执行官”则接收语言指令,融合多模态视觉信息,通过模仿学习生成精确的机器人动作指令(20个维度),实现了从语言指令到物理动作的转化。

💡 该技术通过模仿学习(Imitation Learning)和DAgger(数据集聚合)技术进行训练,让机器人在观看人类专家手术录像和文字记录以及实时纠正中不断学习和完善。这种基于语言的规划方式使得人类监督者能够清晰理解机器人的“意图”,为建立信任和必要时的干预奠定了基础。

⚠️ 尽管SRT-H在离体实验中展现出巨大潜力,但其局限性不容忽视。实验环境理想化,未考虑真实手术中的出血、组织粘连等复杂情况;手术速度慢于人类医生;且泛化能力有限,将技术扩展至其他手术类型需要海量数据和训练成本。这些都是通往临床应用前必须克服的挑战。

🚀 SRT-H的出现对当前“达芬奇”机器人主导的“主从遥操作”模式构成了长远挑战,预示着手术机器人行业将从“增强医生”的工具,转向具备初步自主性的“赋能系统”。这一转变将深刻影响外科医生的角色、手术室流程乃至医疗责任的法律框架,为AI驱动的自主手术未来开辟道路。

AI Keymaker:手术台上的AlphaGo:约翰霍普金斯大学发布自主手术机器人

近期,一项来自约翰霍普金斯大学(JHU)的研究,在全球AI与医疗科技领域引发了高度关注。其发布的SRT-H框架,成功地让手术机器人在无人类直接操控的情况下,100%自主完成了离体猪胆囊切除术。这一成果并非简单的技术迭代,它在更深的层面上,预示了手术机器人领域一个根本性范式转变的可能——从人作为“操作员”的时代,迈向人作为“监督者”的时代。

本文将深度剖析SRT-H的研究,探讨其演进脉络、技术核心、真实价值,以及在通往未来的道路上,它必须面对的挑战与局限。

从STAR到SRT-H:一条清晰的演进之路

要理解SRT-H的突破性,我们需要回溯到2022年。当时,同样来自JHU的STAR(智能组织自主机器人) 登上了《科学》杂志封面,它成功完成了高难度的肠道吻合术,其精确度甚至超越了人类外科医生。然而,STAR的成功建立在两个关键前提上:

这些前提限制了其在复杂多变的真实手术环境中的应用。而本次的SRT-H,正是为了拆除这些“脚手架”而生。

SRT-H的核心演进在于,它不再依赖任何外部标记,而是通过“眼睛”(摄像头)和“大脑”(AI模型)直接理解手术场景,并自主作出判断。这标志着从“自动化”到真正“自主化”的关键一步。

技术解码:SRT-H的双层“大脑”是如何工作的?

SRT-H的创新之处在于其精巧的分层式(Hierarchical)框架。它模仿了人类外科专家“先思考,后动手”的工作模式,将复杂的任务分解为一个高层“指挥官”和一个低层“执行官”。

高层策略:“手术指挥官”

这一层级可被视为机器人的“大脑皮层”。它接收内窥镜的实时视频流,通过强大的视觉模型(Swin Transformer)进行分析,其核心任务是:

这种基于语言的规划方式,极大地提升了系统的可解释性和鲁棒性。人类监督者可以清晰地看到机器人的“意图”,并在必要时进行干预。

低层策略:“精英执行官”

这一层级可被视为机器人的“小脑和神经系统”。它接收来自高层的语言指令,并将其转化为精确的物理动作。其工作流程是:

值得注意的是,该系统通过模仿学习(Imitation Learning) 进行训练,即观看人类专家的手术录像和文字记录来学习。研究中还采用了DAgger(数据集聚合)技术,允许专家在模拟过程中对机器人的行为进行实时纠正,从而让模型在错误中学习,不断完善自身策略。

实验与结果:100%成功率背后的价值与局限

研究团队在8例离体猪胆囊上进行了胆囊切除术的自主操作实验。结果显示,SRT-H的成功率为100% ,所有关键步骤均自主完成,无需人类中途接管。这是一个令人振奋的成果,它验证了“步骤级自主性”(step-level autonomy)的可行性——即机器人能够自主完成一个完整、多步骤的外科手术子任务。

然而,我们必须冷静地看待这一成果,并认识到其现阶段的局限性:

“我们正在从一个僵化的、预先编程的系统,转向一个能够基于实时视觉做出判断的系统,这更像是一个人类外科医生。”
— Axel Krieger,约翰霍普金斯大学副教授

行业影响:对“达芬奇”模式的深远挑战

SRT-H的出现,对当前由“达芬奇”机器人所主导的“主从遥操作”模式构成了长远的、根本性的挑战。虽然在短期内它无法撼动达芬奇的商业地位,但它指明了一个完全不同的技术方向。

目前的主流模式是增强医生,而SRT-H探索的是赋能系统。前者是更强大的工具,后者则是具备初步自主性的伙伴。这一转变将深刻影响外科手术的未来,包括外科医生的角色定义、手术室的工作流程,乃至医疗责任的法律框架。

机器人自主手术还远吗

在我看来,SRT-H最重要的贡献,并非其100%的成功率,而是它在技术上完整地回答了一个困扰业界多年的核心问题:我们能否构建一个可解释、可纠正且足够可靠的自主手术系统?

通过其精巧的分层设计和对语言的运用,JHU团队给出了一个肯定的答案。高层策略的语言指令让机器人的“心智”变得透明,这是建立人类信任的第一步,也是所有“自动驾驶”系统从实验室走向现实的关键所在。

尽管前路漫漫,从离体猪胆囊到人类手术台的距离,可能比我们想象的要远得多。但SRT-H无疑已经将手术室的大门,向一个由AI驱动的、更自主的未来,推开了一道清晰可见的缝隙。值得我们保持关注和思考的关键变量将是,实现活体(in-vivo)实验需要多久,以及整个行业如何为这场深刻的变革做好准备。

引用资料

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI手术机器人 约翰霍普金斯大学 SRT-H 自主手术 医疗科技
相关文章