差评 02月25日
宇树的机器人又进化了,学哪吒跳舞,还能挑战平衡木。
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

宇树科技人形机器人近期再次进化,不仅能完成梅花桩挑战和平衡木行走,还能跳舞和学习推轮椅。这些新技能并非宇树员工亲手调教,而是上海AI实验室联合国内顶尖大学的研究成果。两篇论文分别介绍了BeamDojo强化学习框架和HOMIE远程控制系统,旨在解决人形机器人在运动控制、数据采集和成本上的难题。BeamDojo专注于人形机器人在复杂地形上的敏捷运动,而HOMIE则通过低成本的外骨骼设备实现全身远程控制,为具身智能的发展提供了新的解题思路。

👣BeamDojo强化学习框架:该框架专门针对人形机器人设计,使其能够在平衡木等复杂地形上实现快速稳定的行走。通过引入落脚点奖励机制,结合地形数据和机器人脚底的采样,判断每一步是否踩在安全区域内,从而提高机器人在复杂地形下的适应能力。

🕹️HOMIE远程控制系统:该系统通过一套低成本的外骨骼设备(机械手臂、智能手套、脚踏板),让研究人员能够用全身控制机器人。其核心技术包括上半身姿态课程学习、高度追踪奖励和对称性利用,旨在实现更精确、协调的机器人动作。

💰成本优势与数据精度:HOMIE系统的外骨骼设备硬件成本仅为3500元人民币,远低于其他同类远程控制方案。同时,该系统在数据采集精度方面也优于VR设备方案,为机器人数据采集提供了一种低成本、高精度的解决方案。

原创 世超 2025-02-25 00:03 浙江


既能上春晚扭秧歌,又能模仿科比的后仰跳投、复现 C 罗的腾空半转身。


前阵子,宇树科技的人形机器人,可谓是出尽了风头。


结果这还没几天,他们家的机器人就又双叒进化了。


梅花桩挑战,没有一步踩空,走得稳稳当当。


不光能正着走,倒着走也如履平地,这换个真人来都不一定能做到好吧。。。


平衡木虽说走出了一种喝醉的感觉,但好歹也没摔。


还有更酷炫的,舞一曲哪吒的《 天雷滚滚我好怕怕 》


指望以后机器人给养老的,看看 G1 现在也开始学推轮椅了。


夸张点,要是 G1 按照这一月好几次进化的速度,或许明年就能进咱家当保姆了。


不过说起来,这些新技能,其实并不是宇树的员工亲手调教出来的。


像前面挑战梅花桩的 G1 ,就是上海 AI 实验室联合了国内好几所顶尖大学,一起研究出来的成果。而那个蹭了哪吒热度的 G1 ,也是出自上海 AI 实验室等机构之手。


所以世超这次也研究了一波两篇论文,发现这俩研究一个能让人形机器人挑战高难度地形,另外一个,则是把远程控制机器人的成本打了下来。


可以说这俩研究成果,为现阶段人形机器人在运动控制、数据采集还有成本上的难题,都提供了更新的解题思路。


咱先来看第一篇论文,《 BeamDojo : Learning Agile Humanoid Locomotion on Sparse Footholds 》( BeamDojo :在稀疏立足点上学习敏捷类人运动)。


里面有俩地方还挺值得一唠。


以前复杂地形的实验,多是针对四足机器人的,那脚的形状跟人形的压根不一样。即使有针对人形机器人的训练,效率也不高,但 BeamDojo 划重点就是 “ 人形机器人 ”“ 复杂地形 ”“ 高效 ” 


另外一点,就是零样本泛化这种举一反三的能力。


所以 BeamDojo 强化学习框架,设计了一种专门针对人形机器人的训练方法,让机器人能在平衡木这些复杂地形上,走得又快又稳。


就比如训练过程中,研究人员引入了一个落脚点奖励机制


可以结合地形数据和机器人脚底的采样,计算它踏出去的每一步,是否踩在安全区域内。


如果大部分采样点在安全区域内,自然有奖励,反之就要挨罚。


另外,这篇论文的实验中,还提到了从仿真环境到真实世界, BeamDojo 的零样本泛化的成功率有 80% 。


换句话说,在仿真环境中训练好之后,到了真实地形上,不需要额外的微调,机器人也有很大概率能走得又快又稳。


这种能力,对于机器人来说非常重要,所以也成为了现在学界和业界的主流研究方向。


像 AI 大牛李飞飞和她的研究团队,之前就发布过一篇论文, “ 数字表亲 ” 可以让机器人零样本泛化的成功率达到了 90% 。


另外一篇论文,介绍的其实是一个人形机器人远程控制系统。


这跟上次斯坦福那个,也是远程控制的 Aloha 机器人不太一样。以前只是控制双臂,但上海 AI 实验室的 HOMIE ,可以控制机器人全身的自由移动。


实现的原理大概就是设计了一套外骨骼设备( 机械手臂、智能手套、脚踏板 ),让研究人员可以通过这个 “ 驾驶舱 ” ,用全身控制机器人。


这套系统的强化学习框架中,也涉及到了三个核心技术:上半身姿态课程学习、高度追踪奖励和对称性利用


专业名词听起来很吓人,但概念理解起来也没那么难。


像上半身姿态课程学习,就是让机器人学习更多、更复杂的上肢动作。


而高度追踪奖励,跟训狗一个道理。让机器人下蹲或者站立到某个高度,完成任务就能获得奖励。对称性利用,说白了就是让机器人的左右两边的动作更协调、一致。


最主要的是,外骨骼设备的硬件成本,只需要 3500 ,人民币。


这要比其他同样是做远程控制方案的机器人,成本要低得多。比如斯坦福 Aloha 机器人的硬件成本,就要 3.2 万美元,在当时看来,已经算比较低了。


所以这么一对比,更显得 3500 元是击穿地板价的存在。


而且从数据采集的精度来看,也要比 VR 设备的方案要更高( 论文中是跟 OpenTeleVision 进行了对比 )。


所以世超觉着, HOMIE 最大的贡献之一,或许就是找到了一种低成本、高精度的机器人数据采集方法。


看下来,不管是 BEAMDOJO 强化学习框架,还是 HOMIE 控制系统,这些前沿研究,都是冲着具身智能的疑难杂症去的。


不可否认,现阶段的具身智能还远没能达到,科幻电影中的完美对照。


但现在的机器人就特别像,十年前的 AI 。那个时候,也没有人预想到 ChatGPT 、 DeepSeek 的出现,什么 AI 视频、 AI 音乐,更是天方夜谭。


因为大部分的技术探索,咱们平时也接触不到,所以只有当质变发生以后,我们才会反应过来。


结合今年刚开年就新动态不断的机器人行业,世超赌一手,不说应用大规模落地,但在机器人的灵活性、适应性上,今年肯定有的看了。


前两天,宇树科技的王兴兴不还说,预计年底他们家人形机器人 H1 的跑步速度,就要达到了 10m/s 。这速度,跟博尔特都有的一比。


反正,咱们就等着看吧。


撰文:西西

编辑:江江&面线

美编:焕妍


图片、资料来源

上海人工智能实验室公众号、《机械公敌》电影截图

《HOMIE: Humanoid Loco-Manipulation with Isomorphic Exoskeleton Cockpit》

《BeamDojo: Learning Agile Humanoid Locomotion on Sparse Footholds》

https://homietele.github.io/

https://why618188.github.io/beamdojo/




阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

人形机器人 具身智能 强化学习 远程控制 AI实验室
相关文章