MIT 科技评论 - 本周热榜 12小时前
机械双臂也能“一心多用”?北航团队提出双臂任务规划新框架
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

北京航空航天大学团队研发的RoboPARA框架,通过创新的两阶段规划策略,显著提升了双臂机器人的协作效率。该技术利用大模型构建任务逻辑并优化并行调度,使其在服务业、工业、医疗等多个领域展现出广泛应用潜力。实验证明,RoboPARA在工作效率和任务成功率上均优于现有方法,为机器人技术在实际场景中的应用提供了新的可能性。

🤖 RoboPARA框架的核心在于两阶段规划策略:第一阶段构建依赖图生成任务逻辑并消除冗余,第二阶段通过图重遍历算法优化双臂并行调度。这种“双重优化”机制显著提升了机械臂的协作效率,使其能像人类厨师一样灵活操作。

💡 该技术在多个领域具有广泛应用前景:在服务业可应用于智能售卖厅和智慧厨房;在工业领域适用于柔性制造生产线和汽车生产车间;在医疗辅助、农业自动化、灾后救援以及家庭服务等场景也具有重要价值。

✅ RoboPARA在实验中表现出色:与现有方法相比,其平均并行协作步骤超过4.5倍,执行时间减少30%至50%,在具有挑战性的任务中,成功率高出34%。研究团队还开发了专门用于评估双臂任务并行性的X-DAPT数据集。

⚠️ 尽管RoboPARA在任务级适应方面展现出初步的动态适应能力,但仍面临死锁问题的挑战。研究团队正在努力通过架构革新、模型轻量化和深入到控制层面来解决这些问题,推动双臂机器人在工业界的落地应用。

当你在快餐店等待一份现制三明治时,是否设想过这样的场景:如果机器人能够像人类厨师一样灵活协调双臂——一边煎制培根,一边涂抹酱料,同时整理餐盒,那么顾客的等待时间很可能大幅缩短。

如今,这一构想正随着机器人技术的发展而逐渐走向现实。北京航空航天大学助理研究员范肇心团队与北京人形机器人创新中心合作,为解决并行高效操作难题,提出了一种名为 RoboPARA 的双机械臂任务规划框架。

该框架的核心创新在于采用基于大模型的两阶段规划策略:第一阶段通过构建依赖图生成任务逻辑,并通过检索增强生成消除语义冗余;第二阶段则通过图重遍历算法对双臂的并行调度进行深度优化。这种“双重优化”机制显著提升了机械臂的协作效率。

(来源:该团队)

从应用前景来看,这项技术在需要复杂操作协同的领域展现出广泛的应用潜力:在服务业可应用于智能售卖厅和智慧厨房(包括烹饪机器人及家务机器人);在工业领域适用于柔性制造生产线和汽车生产车间;在医疗辅助(如手术机器人)、农业自动化、灾后救援以及家庭服务等场景也具有重要的应用价值。

经实际验证,该技术已在包括天工人形机器人、Franka 和 UR5e 在内的多种机器人平台上完成测试。实验数据显示,其工作效率和任务成功率优于现有方法。值得一提的是,为促进学术交流和技术发展,研究团队即将开源项目代码和完整数据集。

(来源:该团队)

日前,相关论文以《RoboPARA:面向多任务的双臂机器人并行分配重组规划方法》(RoboPARA: Dual-Arm Robot Planning with Parallel Allocation and Recomposition Across Tasks)为题发表在预印本网站 arXiv 上 [1]。北京航空航天大学研究生段仕英和北京人形机器人创新中心任沛是共同第一作者,北京航空航天大学范肇心、中国人民大学孙怡帆教授和北京人形机器人创新中心任沛担任共同通讯作者。

图丨相关论文(来源:arXiv)

如今,大模型虽已成功应用于活动规划等任务,但在处理复杂规划场景时仍面临显著瓶颈,其实际能力尚需更全面的验证。

针对这一挑战,研究团队从日常生活场景中获得关键启发——以早晨起床后的多任务处理为例,人们需要同时协调烧水、洗漱、整理衣物等一系列活动,这些任务有的可以并行执行,有的则存在先后依赖关系,或者需要在等待间隙插入其他任务。

然而,规划任务本质上具有多解性,团队研究发现,直接使用大模型进行任务规划时,由于模型自身的推理能力有限,可能会产生“规划幻觉”现象。具体表现为:模型可能以高度自信的态度输出规划结果,但这些方案却存在实质性错误,例如遗漏关键操作步骤或违反物理约束条件。

图丨RoboPARA 框架(来源:arXiv)

为系统解决大模型在复杂规划中的固有缺陷,RoboPARA 框架创新性地提出了两阶段处理流程,实现了对传统规划范式的突破性改进。

在第一阶段的依赖图规划候选生成中,系统通过构建有向无环图(DAG,Directed Acyclic Graph)精确建模任务间的拓扑关系,智能识别并消除冗余操作节点。

范肇心对 DeepTech 举例说道:“在厨房场景下,RoboPARA 如同一位技艺精湛的主厨,面对多份订单时能统筹规划不同套餐的切配、烹制和装盘流程,使机器人获得像人类那样的全局调度能力。”

图丨范肇心老师和博士同学(来源:范肇心)

在第二阶段的图重遍历优化中,算法通过对 DAG 的智能遍历,在确保任务逻辑完整性的前提下,实现双臂操作并行度的最大化。以工厂装配线为例,该技术可让双机械臂像配合默契的工人搭档,同步执行差异化操作从而显著提升产线效率。“通过这种方式,能够有效避免大模型幻觉带来的问题。”范肇心表示。

为了验证 RoboPARA 的有效性,该团队开发了首个专门设计用于评估双臂任务并行性的数据集——X-DAPT(Cross-Scenario Dual-Arm Parallel Task)数据集。范肇心表示:“为更好地应对工业界应用的复杂情况,我们在制作数据集时充分考虑了商业场景的需求。”

与现有实验室导向数据集不同的是,X-DAPT 包含 1000 余个任务模块,覆盖了从厨房烹饪到农业温室管理,从办公室服务到工厂组装等 10 类核心场景,每个场景又细分为简单、中等、困难三级难度梯度。

图丨X-DAPT 数据集的统计评估(来源:arXiv)

大量实验表明,RoboPARA 在各项指标上均显著优于现有方法。在复杂任务组合中,它实现了更高的效率和可靠性。与传统方法相比,RoboPARA 的平均并行协作步骤超过 4.5 倍,执行时间减少 30% 至 50%。在具有挑战性的任务中,其成功率比其他方法的平均水平高出 34%,展现出高稳定性和适应性。

虽然当前研究在数据集构建和算法设计中尚未系统性地考虑动态环境因素,但 RoboPARA 框架已展现出初步的动态适应能力。这种能力主要源于算法设计之初就集成的检索增强机制,其多模态输入特性(不仅包含文本指令,还整合了视觉感知数据)为动态响应提供了基础支撑。

以制作热狗三明治套餐为例,当接收到文字指令后,机器人并非立即执行操作,而是会先通过视觉系统捕捉环境状态,识别食材和工具的实时空间分布,评估资源完备性,继而生成适应性规划方案。

这种“感知-理解-决策”的闭环机制,使得系统在面对新任务场景(如不同套餐订单)时,能够通过环境感知、记忆检索和大模型推理的协同作用,实现一定程度的自主决策和动态调整。

表丨不同任务难度下基于 GPT-4o 基础模型的双臂任务规划量化结果(来源:arXiv)

需要说明的是,当前系统的动态能力主要体现在任务级适应(如新订单处理)而非操作级适应(如动态物体抓取),这也构成了未来研究的重要拓展方向。

然而,不可忽视的是,该框架在任务规划过程中仍面临死锁问题的严峻挑战。从技术实现层面来看,死锁现象源于 DAG 遍历时的循环依赖:当大模型生成的规划方案在任务图上形成闭环时,系统会陷入有限几个任务的无限循环而无法推进。

范肇心坦言:“在研发初期,我们尝试了多种方法引导大模型生成无死锁的规划图,但在当前版本中仍未完全解决这个问题。”为此,团队引入传统规划方法作为补充机制来破解死锁问题。

这种两阶段的折中方案虽然保证了系统的基本可用性,但从长远来看,研究人员希望未来能够发展出端到端的规划范式——要么完全摆脱对规划图的依赖,要么实现图的智能生成与死锁预防,从而消除对传统解锁方法的依赖。

基于此,研究团队正着眼于以下三个关键发展方向:

首先是架构革新,致力于构建更简洁的端到端规划系统,逐步降低框架复杂度。

其次是模型轻量化,在保持规划性能的前提下,探索如何将算法部署到包括北航团队开发的 TinyLLaVA、阿里千问等 7B 参数以下的轻量级基座,以增强端侧适用性。

最后是深入到控制层面,推动研究从任务级规划向动作级控制延伸,实现“视觉-语言-动作”的深度融合。“这三个方向不仅具有学术价值,也有望推动双臂机器人在工业界的落地应用。”范肇心说。

参考资料:

1.https://arxiv.org/abs/2506.06683

运营/排版:何晨龙

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

双臂机器人 RoboPARA 人工智能 机器人技术
相关文章