2025-02-21 23:58 广东
Figure最新发布惊艳在何处?人形机器人的Deepseek时刻!
#Helix:全球首个人形机器人上半身高速连续控制的开源模型
1、 Helix构建了一套端到端的神经网络,不需要事先训练或编程,只用自然语言,就能让人形机器人抓取几乎所有家庭用品,包括之前没接触过的东西,而且可以两个机器人协作干家务。
2、开创性的双系统架构:S2(大脑)-场景理解和语义解析,负责决策;S1(小脑)-负责执行和调整动作,即头部、上半身、灵巧手的连续行动和抓取,通过视觉系统(单眼图像)+运算载体(驱控卡)+传感器(编码器)+算法,实现毫秒级实时响应。
3、开源,开发者可以单独迭代其中任意一个子系统(大脑或小脑)。
#Helix=机器人大脑
Helix是一个通用的视觉-语言-行动(VLA)模型,能够将感知、语言理解和机器人控制相结合,从而实现全方位控制机器人。
1)Helix系首个真正运行在人形机器人上的端到端大模型,模型架构整体分为VLM+动作模块;
2)视频中根据自然语言实现多物品抓取等操作,展现了思维推理能力/语言理解能力的同时展现极强的泛化能力。
#创新亮点
全上半身控制:首次对整个人形上半身(包括手腕,躯干,头部和单个手指)高速连续控制的VLA;
多机器人协作:首个在两个机器人上同时操作的VLA,使他们能够解决一个共享的、长期的操作任务;
泛化能力较强:能够根据自然语言提示,捡起几乎任何小的家用物品(包括以前从未遇到过的数千件物品);
一个神经网络:仅使用一组神经网络权重来学习所有行为—,而无需任何特定任务的微调;
商用部署就绪:首个完全在嵌入式低功耗gpu上运行的VLA,为商业化部署做好准备。
#大幅减少训练时长和数据量
S2只有7B参数,S1只有80M参数,使用了小于500小时的数据,相当于此前训练收集的数据量的5%,不用再依赖造出许多机器人实体来训练。意味着机器人量产落地大大加快了。
#投资方向有哪些?
1、小脑(运控)将成为人形机器人企业的核心竞争力,更稀缺
- 固高科技:唯一具备23位磁编码器+运控算法,可在低成本下实现毫秒级实时响应
- 雷赛智能:驱控+算法+编码器全栈解决方案
2、人形机器人不再局限于特定场景、特定任务(工业等),可直接进入家庭
- 中坚科技:投资的1X是专为家庭场景设计的人形机器人
3、Helix可以直接控制手,灵巧手将迎来飞速发展
- 震裕科技:为Figure提供灵巧手蜗轮蜗杆
- 兆威机电:灵巧手及模组(微型齿轮箱+微电机)
- 丰立智能:灵巧手微型齿轮箱,配套星动纪元,已送样H、APPLE等
- 空心杯电机:拓邦股份、鸣志电器、伟创电气、江苏雷利
4、传感器重要性提升
- 触觉传感器:福莱新材、汉威科技、高华科技、苏试试验、芯动联科
- 力/力矩传感器:安培龙、东华测试、凌云股份、柯力传感
5、人形机器人量产加速,具身智能扩展到数百万机器人
- 领益智造:为FIGURE提供结构件、散热模具等
- 长盈精密:为FIGURE提供关节齿轮、轴承等
- 丝杠/微型丝杠因更高精度的传动和力控、高稳定性和自锁特性(可上半身动作下半身静止,大幅提升续航),更加受益于Helix:五洲新春、震裕科技、恒立液压
- 同时也拉动了减速器和无框电机的需求:中大力德、步科股份
还有惊喜!1X将发布不同于VLA的神秘新品
今天OpenAI支持的初创机器人企业1X Technologies(简称1X)通过社交平台释放悬念''Something new tomorrow...''(明天会有新事物...),创始人同步在社交平台保证不是另一个VLA模型。
1、海外机器人初创公司具身智能发展不断加速
- 1X创始人BerntBornich今日在社交平台宣布明天公司将有不同于VLA的新产品问世。昨晚Figure AI正式发布视觉-语言-行动(VLA)模型''Helix'',该模型通过语言指令实现零样本泛化操作,海外机器人初创公司军备竞赛推动具身智能行业不断突破。
2、1X发布NEO Beta后沉寂良久,神秘新品值得期待
- 1X是一家专注于开发和生产能够模仿人类行为的机器人的挪威初创企业,OpenAI在2022 年同公司展开了合作,双方决定共同为机器人开发 AI 模型,并在2023年3月领投A2轮融资。这是1X继2024年8月30日发布家务双足机器人NEO Beta后,公司首次在社交媒体公开产品预告。
3、核心受益标的——中坚科技
- 2024年4月,中坚美国、香港兆新与1X Holding AS(1X Technologies 母公司)公司原股东签署了相关股权转让协议,股权交割完毕后中坚美国持股占比51%,香港兆新持股占比49%。
- 1X早期旗舰产品轮式机器人EVE已成功投入商业化应用,新一代足式机器人NEO正在逐渐攻克家用消费应用场景。中坚科技作为其股东与合作伙伴,有望在其机器人量产时代充分受益。
再强调大脑:后续国内重视本体厂银河通用
早在1月9日,银河通用发布全球首个#完全基于仿真合成数据的具身智能基座抓取大模型GraspVLA。
数据端,团队将各种模型或纹理导入虚拟环境,利用自研合成管线及英伟达渲染引擎模拟现实三维空间。#在虚拟空间中,一周便快速积累10e帧高质量训练数据,速度远超现实世界手动操控机器人获取数据。
GraspVLA预训练阶段,训练数据即使用上述采集到的虚拟空间数据。#部署训练后模型的真实世界机器人,面对训练数据中未出现的光照、背景环境,都能够准确抓取物体,拥有较强的泛化能力。
对于未出现在合成数据中的类别,仅经过互联网图文数据联合预训练(让模型“学会”图像与相应抽象概念的联系),GraspVLA也能准确识别并把抓取能力泛化迁移。
#后训练阶段,团队仅使用少量数据,便可实现自定义模型的抓取顺序、抓取策略,并可泛化至其他罕见物体。
团队基本解决了模拟环境与现实环境的对齐问题,而虚拟环境下能够快速积累训练数据,#具身智能模型缺乏训练数据的问题将被缓解,人形机器人能够更快实现实际的落地应用。
银河通用除发布GraspVLA抓取大模型外,还将要发布导航VLA模型,同样具有泛化能力。如果说宇树是小脑发达,那么#银河通用便是大脑发达,对标昨晚Figure推出的Helix。
1、再强调大脑是本体厂的核心,而大脑的投资机会就是【整车AGI】,本质跟机器人一样。
整车板块不少公司基本面扎实且有底,而同时凭借同样领先的训练算力积累、车队规模(意味着大量私有训练数据),在今年有望实现智驾的真正差异化,实现估值重塑。
2、看好银河通用的供应链投资机会。